样本均值的抽样分布是所有的样本均值形成的分布,即μ的概率分布。样本均值的抽样分布在形状上却是对称的。随着样本量n的增大,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值μ,方差为总体方差的1/n。这就是中心极限定理(central limit theorem)。
样本均值的抽样分布是所有的样本均值形成的分布,即μ的概率分布。样本均值的抽样分布在形状上却是对称的。随着样本量n的增大,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值μ,方差为总体方差的1/n。这就是中心极限定理(central limit theorem)。
(一)样本均值的抽样分布
设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有
种抽法,即可以组成不同的样本,在不重复抽样时,共有即样本均值的期望就是总体均值。
无限总体,样本均值的方差为总体方差的1/n,即
有限总体,样本均值的方差为
(x为平均数)其中, 为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,N比较大而n/N≥5% 时,修正系数可以简化为1-n/N,当N比较大,而n/N<5%时,修正系数可以近似为1,即可以按重置抽样计算。
当总体服从正态分布时,样本均值一定服从正态分布,即有X~N( )时,
若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接近正态分布。样本分布的期望值为总体均值,样本方差为总体方差的1/n 。这就是统计上著名的中心极限定理。该定理可以表述为:从均值为μ、方差为σ^2(有限)的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n ≥30),样本均值的分布近似服从均值为μ ,方差为σ^2/n 的正态分布。
如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布,服从t分布。