如何区分超几何分布和二项分布?
一句话,一个是有放回抽取(二项式分布),一个是没有放回抽取(超几何分布)。
比如20个球里有5个黑球和15个白球。如果抽三次,每次放回去,每次抽黑球的概率是1/4,独立于其他时间。这显然是一个独立的重复实验,对应的概率模型是二项分布。
特征还是很明显的。举个例子,上面的例子我拿了六次,如果不放回去,里面最多有五个黑球。但是如果你把它放回去再画,你可以把六次黑球都画出来。
两者之间还有一个联系,就是当总数和抽的次数相比非常大的时候,两者非常接近。比如65,438+0,000个球,里面200个黑,800个白,抽三次。如果每次抽到一个黑球的概率是1/5,那么第一次抽到而没有放回去的概率是1/5。第二次,如果白的第一次是200/999或约1/5,黑的第一次是199/999或约1/5,第三次也是如此,每次的概率约为1/5,可根据二项分布的独立重复检验近似计算。