如何区分超几何分布和二项分布？

一句话，一个是有放回抽取(二项式分布)，一个是没有放回抽取(超几何分布)。

比如20个球里有5个黑球和15个白球。如果抽三次，每次放回去，每次抽黑球的概率是1/4，独立于其他时间。这显然是一个独立的重复实验，对应的概率模型是二项分布。

特征还是很明显的。举个例子，上面的例子我拿了六次，如果不放回去，里面最多有五个黑球。但是如果你把它放回去再画，你可以把六次黑球都画出来。

两者之间还有一个联系，就是当总数和抽的次数相比非常大的时候，两者非常接近。比如65，438+0，000个球，里面200个黑，800个白，抽三次。如果每次抽到一个黑球的概率是1/5，那么第一次抽到而没有放回去的概率是1/5。第二次，如果白的第一次是200/999或约1/5，黑的第一次是199/999或约1/5，第三次也是如此，每次的概率约为1/5，可根据二项分布的独立重复检验近似计算。