超几何分布是一种离散概率分布,它用于描述从有限的总体中随机抽取一定数量的样本,其中包含了固定数量的成功样本和失败样本的概率分布。超几何分布的方差公式如下:
Var(X) = N * K * (N - K) * (N - n) / (N^2 * (N - 1))
其中,X为超几何分布的随机变量,N为总体大小,K为总体中成功样本的数量,n为抽取的样本数量。
超几何分布的方差公式可以通过以下步骤进行推导:
首先,超几何分布的期望为 E(X) = n * K / N。
然后,根据方差的定义,有 Var(X) = E(X^2) - E(X)^2。
接下来,需要求出 E(X^2)。由于超几何分布的随机变量只能取整数值,因此 E(X^2) 可以表示为:
E(X^2) = Σx^2 * P(X = x)
其中,Σ表示求和,x表示超几何分布的所有可能取值,P(X = x)表示X取值为x的概率。
考虑到超几何分布的取值与样本中成功样本的数量有关,因此可以将上式写为:
E(X^2) = Σ(k * (n - k) * C(k, m) * C(N - k, n - m)) / C(N, n)
其中,k表示总体中成功样本的数量,m表示随机抽取的n个样本中成功样本的数量,C(k, m)表示从k个成功样本中选出m个成功样本的组合数,C(N - k, n - m)表示从N - k个失败样本中选出n - m个失败样本的组合数。
最后,将 E(X^2) 和 E(X) 的值带入 Var(X) 的公式中,即可得到超几何分布的方差公式。
需要注意的是,当样本数量n相对于总体数量N较小时,公式的分母中的 (N - 1) 可以近似为 N,此时方差公式可简化为:
Var(X) ≈ N * K * (N - K) * (n - K) / (N^2)