超几何分布是一种离散概率分布,主要用于描述在不放回抽样的情况下,样本中具有某种属性的对象数量的概率分布。它广泛应用于统计学、生物学、质量管理等领域。超几何分布的参数包括总体中的对象总数\(N\),具有特定属性的对象数\(K\),以及从总体中抽取的样本大小\(n\)。
超几何分布的期望
超几何分布的期望值(或平均值)可以通过以下公式计算:
\[E(X) = n \cdot \frac{K}{N}\]
这里,\(X\)代表随机变量,表示在样本中具有特定属性的对象数量。这个公式直观地反映了这样一个事实:期望值与样本大小\(n\)成正比,与具有特定属性的对象比例\(\frac{K}{N}\)也成正比。
超几何分布的方差
超几何分布的方差可以使用下面的公式来计算:
\[Var(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N-n}{N-1}\]
这个公式展示了方差不仅依赖于样本大小\(n\)和总体中具有特定属性的对象比例\(\frac{K}{N}\),还依赖于样本抽取后对总体的影响程度,这体现在\(\frac{N-n}{N-1}\)这一项上。随着样本量\(n\)接近总体大小\(N\),这一项会变得更大,表明方差增加,这是因为样本的抽取对总体的影响更加显著。
应用实例
假设我们有一个包含100个球的袋子,其中30个是红色的,70个是蓝色的。如果我们随机抽取10个球而不放回,那么在这个过程中抽取到红球的数量遵循超几何分布。根据上述公式,我们可以计算出抽取到红球的期望数量为\(10 \cdot \frac{30}{100} = 3\),并且可以通过方差公式进一步了解抽取红球数量的波动情况。
超几何分布在处理有限总体且不放回抽样问题时提供了强大的工具,帮助我们理解和预测结果的分布特性。