由于均数较易受极端值的影响,因此可以考虑将数据进行行排序后,按照一定比例去掉最两端的数据,只使用中部的数据来求均数。如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消;反之,则说明数据中有极端值,此时截尾平均数能更好地反映数据的集中趋势。
由于均数较易受极端值的影响,因此可以考虑将数据进行行排序后,按照一定比例去掉最两端的数据,只使用中部的数据来求均数。如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消;反之,则说明数据中有极端值,此时截尾平均数能更好地反映数据的集中趋势。
算术平均数的值会受到极端值的影响。在很多情况下,我们需要消除极端值对平均数的影响,例如,在文艺或体育比赛中的评分要去掉若干个最高分和最低分,再计算剩余数据的平均值,这样计算得到的就是截尾平均数。
式中:表示截尾系数,表示数据个数,表示去掉的数据个数。
表示将数据按升序排列后的顺序序列。
例1 2011年中央电视台钢琴、小提琴大赛的评分办法为:比赛采用百分制,按评委序号现场亮分,每位选手的演奏得分去掉最低分、最高分后的平均值。下列数据是11位评委给某一小提琴选手的分数,按照此次大赛评分办法,求这位选手的演奏得分。
解: 先将数据按升序排列,求出最高分和最低分。最高分为98.7,最低分为94.8。
由于
,所以,将数据代入公式得,即这位选手的得分是97.025分。例2 12位评委对某作品的评价分值为(100分制):42 45 60 65 70 75 80 85 86 88 95 98。
若去掉两个最高分和两个最低分,则平均分值为
若将数据分为四等分,首尾各去掉一部分,则平均分值为
组距频数分布也可以计算截尾平均数,计算过程是:
第一,确定第一个
分位数和最后一个分位数。第二,假定
分位数所在组的观察值均匀变化,按比例确定第一个分位数到该组上限的观察值频数,与最后一个分位数到该组下限的观察值频数。具体做法是,用分位数与该组上限(对第一个分位数)或下限(对最后一个分位数)的距离除以分位数组的组距,再以得到的系数乘以分位数组的频数即可。第三,重新以
分位数作为第四,按一般组距频数分布计算平均数的方法,计算截尾算术平均数。