统计理论的统一折叠

据权威统计史记载,自17世纪开始,就有了“政治算计”和“国情研究”。

即原始社会统计,起源于英国和德国。几乎与此同时,意大利出现了“赌博数学”,即初等概率论。直到19世纪,因为大数定律和概率论中的误差理论,才形成了初级的数理统计。也就是说,社会统计学的形成比数理统计学早了两个世纪。由于社会统计在经济和政治中的广泛应用,它受到了各国历届政府的高度重视,并得到了系统的发展。20世纪40年代以后,由于概率论的发展,数理统计得到了迅速发展。经过近400年的变迁,世界形成了社会统计和数理统计两大体系。经过30多年的学习和研究,王教授发现了社会统计与数理统计的联系和区别。它们之间的关系非常类似于牛顿力学和相对论之间著名的关系。相对论力学在光速附近使用,但在大多数情况下是远离光速的。这时候用牛顿力学就准确方便了。如果硬性套用相对论力学,那就是杀鸡用的屠刀,吃力不讨好。社会统计用于描述变量;数理统计用于描述随机变量。

我们知道变量和随机变量既有联系又有区别。当变量值的概率不是1时,该变量成为随机变量;当一个随机变量的概率为1时,它就变成了一个变量。

明确了变量与随机变量的关系,明确了社会统计与数理统计的关系。以后在描述变量的时候,大胆使用社会统计学;在描述随机变量时,会用到数理统计。如果非要用数理统计来描述变量,那就是用屠刀杀鸡。近70年来,由于数理统计的飞速发展,有一股“吞噬”社会统计学的巨大势头,尤其是以美国为代表的发达国家,几乎认为统计学就是数理统计。其实这是一个很大的误区。王教授的研究表明,数理统计永远不可能“吃掉”社会统计,而且在未来,社会统计与数理统计将并存,互为补充。社会统计学和数理统计学的争论可以结束了。

结语:《社会统计与数理统计的统一》科学地梳理了近400年的统计学,规范了整个统计学的发展,结束了近百年来社会统计与数理统计的争论。因为经济是用统计来衡量和分析的,所以社会统计和数理统计的统一必将从整体上提高经济学的分析水平。

“社会统计与数理统计的理论统一”的重大意义

王指出:社会统计描述变量,数理统计描述随机变量,变量和随机变量是两个既有区别又有联系的数学概念,在一定条件下可以相互转化。王教授对的论述是数学上的一大发现。我们知道“变量”的概念最早是由著名数学家笛卡尔在17世纪提出的,而“随机变量”的概念最早是由苏联学者在20世纪30年代以后提出的,两者相差三个世纪。到王教授为止,世界上还没有第二个人提出过变量与随机变量之间的联系、区别和相互转化。我们知道变量的引入带来了函数论、方程论、微积分等一系列主要数学学科的产生和发展。随机变量的引入奠定了概率论和数理统计的理论基础,促进了它们的蓬勃发展。可见,变量和随机变量的概念是很有价值的,所以把王教授在世界上第一次提出的变量和随机变量的联系、区别和对应变换的意义称为伟大也不为过。

让我们回到“社会统计与数理统计相统一”的理论上来。王教授指出,社会统计学描述的是变量,而数理统计描述的是随机变量。这样,王教授准确地界定了社会统计学和数理统计学的研究范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。结束了近400年来数十甚至数百个统计数字的混战局面,让他们重新回到正轨。

因为变量不断出现,永远延续,所以社会统计学不仅不会消亡,还会继续大发展。当然,数理统计也会因为随机变量的不断出现而有很大的发展。但是,随机变量的研究一般比变量的研究复杂,而且直到今天,数理统计的研究仍处于较低水平,使用起来更复杂;从长远来看,对随机变量的研究最终会逐渐转化为对变量的研究,这和我们通常把复杂问题的研究转化为对几个简单问题的研究是一样的道理。由于社会统计描述的是变量,而变量描述的范围极其广泛,绝不是某些数理统计学家所说的:社会统计只做简单的加减乘除。从理论上讲,社会统计学应该涵盖了除数理统计之外的大部分数学学科的运行。因此,王教授提出的“社会统计与数理统计相统一”的理论,从根本上纠正了统计界长期以来低估社会统计的错误理论,展示了社会统计在理论和应用上的广阔前景。

《社会统计与数理统计的统一》英文版由中国经济出版社于2010年6月出版,已在国外发行。这本书科学地梳理了近400年历史的统计学,规范了整个统计学的发展,结束了100多年来社会统计学和数理统计学的争论。注:本书作者王教授是国际统计学会会员,国际著名数学家。《社会统计与数理统计的统一》一书由中国经济出版社于2010年6月出版,该书将在全球范围内发行,编号:342705出版社:中国经济出版社。统计学的中心问题是如何根据样本探索人口的真实情况。因此,如何从总体中提取一些元素形成样本,什么样的样本最能代表总体,直接影响统计的准确性。如果提取元素的方法是保持总体中的元素不变,那么观测值就是独立的随机变量,与总体具有相同的分布。这样的样本是简单随机样本,是总体的最佳代表,获得简单随机样本的过程称为简单随机抽样。

简单随机抽样是指重复相同的随机测试,也就是说每次测试都是在相同的一组条件下进行的,所以每次测试得到什么结果的可能程度是固定的。对于有限总体,简单随机抽样是指每次抽取一个元素,放回去再抽取。如果不放回去,人口的构成会发生变化,所以再次提取时各种结果的可能性会相对发生变化。至于无限人口,就不需要区分“放回去”和“不放回去”了。

除了上述原则,另一方面,具体的样本获取方法能否保证观测值的独立性是问题的关键。所以,一个样本是否随机,取决于具体的样本获取方式。

采样时,一定要根据不同的研究目的,选择不同的采样方法。

①简单随机抽样法先对每个个体进行编号,然后通过抽签从总体中抽取样本。该方法适用于个体间差异小、待选个体数量少或个体分布集中的研究对象。

②用随机抽样的方法将群体随机分成若干份,然后从每份中随机抽取若干个个体组成样本。这种抽样方法可以更有组织性,所选个体在群体中的分布比简单的随机抽样更均匀。

(3)系统抽样法首先系统地将总体分成若干组,然后从第一组中随机确定一个起点,如每组中的15个元素,决定从第一组中的13个元素中选择,因此后面选择的单位为28、43、58、73等。

(4)分层抽样法根据对人群特征的了解,将人群分为若干个层次或类型,然后从每个层次中按一定比例随机抽取。这种方法是有代表性的,但如果层次划分不正确,就无法获得具有高度代表性的样本。