集中量数
统计资料经过分组归类的初步整理和列表绘图之后,已经能够简化繁冗的数量而窥其分布的大概面貌。但如果要对数据资料进行深入的了解和研究,仅有图表是不够的,还必须计算出描述数据分布状况的特征量,包括集中量数、差异量数和相关量数等。
常用的集中量数有算术平均数、中数、众数和几何平均数。
一. 算术平均数
(一)算术平均数的概念
算术平均数通常称为平均数、均值或均数。它是各变量值的总和除以变量总次数所得之商。(二)算术平均数的优缺点
l 算术平均数是使用最广泛的集中量数。它的优点主要有:第一,反应灵敏,一组数据中的任何一个都对其算术平均数的大小产生影响;第二,严密确定,比较准确;第三,概念简明易懂,计算方法简便;第四,适合代数运算;第五,受抽样变动的影响小。
l 分析算术平均数的缺点主要有:其一,它极易受极端数值的影响而失去代表性,如在一组数据5,7,8,10,20之中,大部分数据都集中于5—10之间,其平均数是10,很显然它不能很好地代表这组数据的中心;其二,算术平均数的精确计算需要每一个数据的确切存在,否则就无法运算。
二. 中位数
(一)中位数的概念
中位数是一组按大小顺序排列的数据中位置居中的数值,简称中数,用符号
表示。它是划分一组数据中较大的一半和较小的一半的数目界限。应当注意的是,中位数只是将一组数据的个数分为相等的两部分,而不是将一组数据的数值分为两个部分,因此,中位数可以不是一个实际观测到的数值,而是一个计算得到的值。中位数诗居中间位置的数,代表一组数据的平均水平,所以它是集中量数的一种。
(二)中位数的优缺点
l 中位数可称为是数据分布的典型值,它的主要优点是:不受极端数据(极大或极小)的影响;意义明确,简明易懂;计算简便;对于开放分布(无上限或下限),用中位数作为集中趋势的代表值比用算术平均数作为代表值更为合适。
l 中位数的缺点主要是:缺乏灵敏性;较易受抽样偏差的影响;不适合代数运算,当需要进一步的统计分析时比较困难。
三. 众数
(一)众数的概念
1.众数的概念---众数也称范数或密集数,它通常是指在一组数据中出现次数最多的那个数值,代表符号为
。
2.对于众数概念的理解,需要注意区分众数数值与它所对应的次数。例如,一组学生语文测验分数中,81分出现的次数最多,共11次,那么,这组数据的众数就是81分,而不是11。
3.在一组数据中,如果某个数据是众数,那就意味着这个数值至少应当出现两次。例如,1,1,2,2,3,3这一组数据的众数是1,2,3。
4.如果同时出现两个数值都具有最高的并且相同的次数,那么,这组数据就有两个众数;如果三个或更多的数据具有相同的最高次数,那么就是有多个众数。例如,1,2,2,3,4,4 这一组数据的众数是2,4。
5.如果全部数据出现的次数都不超过1次,则可说这组数据没有众数或众数不存在,但不能说众数是0。例如,1,2,3,4,5,6 这一组数据没有众数或众数不存在。
6.众数的优缺点---众数表述数据分布的集中趋势很形象,简明易懂;计算简便,适于粗略估算;有利于分析判断具有多个集中点的分布;不易受到极端数据的影响。
(二)众数的优缺点
l 众数表述数据分布的集中趋势很形象,简明易懂;计算简便,适于粗略估算;有利于分析判断具有多个集中点的分布;不易受到极端数据的影响。
l 计算结果不是很精确、很稳定;利用次数分布表所计算的众数,常因组距不同而变化;不适合进行代数运算。