数据类型
有哪些不同类型的数据?
- 定性数据通常是用文字而不是数字来表示的描述某物
- 例如:老师车的颜色
- 定量数据是用数字给出的数据计数或测量某物
- 例如:学生拥有的宠物数量
- 离散数据是需要量化的数据数
- 离散数据只能取特定的值从一组(通常是有限的)值中
- 例如:掷硬币的次数,直到得到反面
- 连续数据是需要量化的数据测量
- 连续数据可以取任何价值在无限值的范围内
- 例如:学生的身高
- 年龄可以离散的还是连续的取决于上下文或如何定义它
- 如果你指的是一个人的年龄,那么这是离散的
- 如果你指的是一个人活了多长时间,那么这是连续的
均值,众数,中位数
平均数,中位数和众数是什么?
- 平均数,中位数和众数是位置
- 位置度量提供了关于数据在数字系统中的位置的信息
- 均值、中位数和众数是集中趋势的度量
- 它们描述了数据中心的位置
- 它们是各种各样的平均
- 在统计学中,明确你所指的平均数是很重要的
如何计算平均值、中位数和众数?
- 您应该已经熟悉如何从原始的、未分组的数据中找到平均值、中位数和众数
- 的模式是发生的值吗最常在数据集中
- 在频率表中集团或类最常发生的将被称为模态类
- 具有多个模式的数据集是双峰
- 的中位数是中间值大小顺序
- 如果数据集中间有两个值,则中位数为中点这两个值
- 如果从a求中值频率表首先找到累积频率,然后找到中间值所在的组或类
- 的的意思是是总和在所有的值中除以值的个数在数据集中
什么是汇总统计及其符号?
- 摘要统计信息是汇总一组数据值的信息
- 为
" class="Wirisformula" role="math" alt="开始mathsize 16px样式n结束样式" style="vertical-align:-4px;height:19px;width:10px" loading="lazy">数据集中的项:n {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 数据的和表示为
-
-
- 通常是这样写的
" class="Wirisformula" role="math" alt="空白金额" style="vertical-align:-13px;height:29px;width:18px" loading="lazy">∑ {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="x" style="vertical-align:-4px;height:19px;width:10px" loading="lazy">读作sigma xx {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 通常是这样写的
-
-
- 数据的均值表示为
-
-
- 它读作' x条'
-
- 在后面的课程中,你会遇到更多的统计摘要
我们如何选择衡量集中趋势的最佳方法?
- 根据数据集的不同,通常使用其中一个平均值比其他平均值更好
- 了解使用每种平均值的优点和缺点是一个好主意
- 均值使用所有的数据值,这对于大数据集来说很好因为所有的值都很接近,但也意味着均值可能会受到极值的影响
- 中位数不受非常高或非常低的值的影响,因此在具有极端值的数据集中使用中是一个很好的平均值
- 模态在很多实际情况下都非常有用,然而通常可能有多个模态,没有模态,甚至一个模态远不在数据集的中间
工作的例子
对于下面给出的数据集,求出众数、中位数和平均值。
23 19 14 28 27 19
四分位数和范围
什么是四分位数?
- 四分位数和百分位数是位置的度量
- 四分位数划分总体或者数据集成四等分
- 的下四分位数,
" class="Wirisformula" role="math" alt="Q下标1" style="vertical-align:-12px;height:28px;width:22px" loading="lazy">把最低的25%和最高的75%分开Q 1 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 的值,
" class="Wirisformula" role="math" alt="Q下标2" style="vertical-align:-12px;height:28px;width:22px" loading="lazy">价值是数据的50%吗Q 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 的上四分位数,
" class="Wirisformula" role="math" alt="Q下标3" style="vertical-align:-12px;height:28px;width:22px" loading="lazy">把最低的75%和最高的25%分开Q 3 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 的下四分位数,
四分位数是如何计算的?
- 对于一个大小的数据集,
" class="Wirisformula" role="math" alt="n" style="vertical-align:-4px;height:19px;width:10px" loading="lazy">,n {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 要找到较低的四分位数,请计算
" class="Wirisformula" role="math" alt="分数分子n + 1除以分母4" style="vertical-align:-14px;height:38px;width:36px" loading="lazy">n + 1 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 如果
" class="Wirisformula" role="math" alt="分数分子n + 1除以分母4" style="vertical-align:-12px;height:38px;width:38px" loading="lazy">如果是整数,那么下四分位数是对应的值n + 1 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 如果
" class="Wirisformula" role="math" alt="分数分子n + 1除以分母4" style="vertical-align:-12px;height:38px;width:38px" loading="lazy">如果不是整数,那么下四分位数是两个值的中点对应于两边的整数n + 1 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="分数分子n + 1除以分母4" style="vertical-align:-12px;height:38px;width:38px" loading="lazy">n + 1 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 如果
- 要找到上四分位数,请计算
" class="Wirisformula" role="math" alt="分数分子大小14px 3开始mathsize 14px风格拉伸左括号n加上1拉伸右括号结束风格超过分母大小14px 4结束分数" style="vertical-align:-12px;height:38px;width:55px" loading="lazy">3 ( n + 1 ) 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18","autoformat":true} - 如果
" class="Wirisformula" role="math" alt="分数分子大小14px 3开始mathsize 14px风格拉伸左括号n加上1拉伸右括号结束风格超过分母大小14px 4结束分数" style="vertical-align:-12px;height:38px;width:55px" loading="lazy">如果是整数,那么上四分位数是对应的值3 ( n + 1 ) 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18","autoformat":true} - 如果
" class="Wirisformula" role="math" alt="分数分子3可伸缩左括号n加上1可伸缩右括号分母4结束分数" style="vertical-align:-12px;height:38px;width:55px" loading="lazy">如果不是整数,那么上四分位数是两个值的中点对应于两边的整数3 ( n + 1 ) 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18","autoformat":true} " class="Wirisformula" role="math" alt="分数分子3可伸缩左括号n加上1可伸缩右括号分母4结束分数" style="vertical-align:-12px;height:38px;width:55px" loading="lazy">3 ( n + 1 ) 4 {"language":"en","fontFamily":"Times New Roman","fontSize":"18","autoformat":true}
- 如果
- 要找到较低的四分位数,请计算
- 中位数可以用同样的方法找到
" class="Wirisformula" role="math" alt="分数分子n + 1除以分母2" style="vertical-align:-17px;height:43px;width:38px" loading="lazy">n + 1 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
范围和四分位数范围是什么?
- 的范围和四分位范围都是传播度量
- 扩展的度量给出了关于数据集的扩展程度的信息
- 的范围两者的区别是什么最大和最小的数据集中的值
- 集合中的所有数据点都将包含在范围内,包括极端值
- 的四分位范围两者的区别是什么上四分位数和下四分位数
- 只有中间的50%的数据包含在四分位数范围内
- 它不受极端值的影响
- 距离和四分位间距的单位与原始数据的单位相同
工作的例子
求出下列数据集的极差和四分位数极差
43 29 70 31 84 56 17 53。
考试技巧
- 要注意平均值和范围之间的区别,特别是在回答要求你描述或比较数据的上下文问题时。记住,平均值表示数据的位置,而范围表示数据的变化程度。