统计推断基础信息有什么特点?

统计推断统计推断是基于随机观察数据(样本)和问题的条件、假设(模型)对未知事物进行的概率推断。它是数理统计的主要任务,其理论和方法构成了数理统计的主要内容。

基本信息特征

统计推断的一个基本特征是它所依据的条件包含随机观察数据。概率论以随机现象为研究对象,是统计推断的理论基础。

表达形式

在数理统计中,统计推断的问题往往表现为以下形式:所研究的问题有一个确定的总体,其总体分布是未知的或部分未知的,通过从总体中抽取的样本(观测数据)得出一些与未知分布有关的结论。比如一群人的身高构成一个整体,一般认为身高服从正态分布,但这个整体的平均值是未知的。随机抽取一部分人测量身高值,利用这些数据估算出这群人的平均身高。这是统计推断的一种形式,即参数估计。如果感兴趣的问题是“平均身高是否超过1.7 (m)”,就需要通过样本来检验这个命题是否成立,这也是一种推理形式,即假设检验。因为统计推断是从部分(样本)推断整体(总体),不能根据样本推断整体,其结论要用概率的形式表达。统计推断的目的是利用问题的基本假设和观测数据所包含的信息,做出尽可能准确可靠的结论。

统计推断是从总体中抽取一些样本,然后通过对抽取部分得到的随机数据进行合理的分析,对总体做出科学的判断。它伴随着一定概率的推测,其特点是:总体是从样本中推断出来的,统计推断是数理统计的核心部分。统计推断的基本问题可以分为两类:一类是参数估计;另一种是假设检验。

方法

在质量活动和管理实践中,人们关心的是具体产品的质量水平,如产品质量特性的平均值和不合格率。这些都需要从总体中抽取样本,通过分析样本的观测值进行估计和推断,即根据样本推断出总体分布的未知参数,称为参数估计。参数估计有两种基本形式:点估计和区间估计。

改进的方法

个体是整体的一部分,局部特征能反映整体的特征。但是,由于整体的异质性和样本的随机性,样本不能准确反映整体。所以,从某些个体的分析中得出的关于人群的结论是错误的,不可靠的。理论上,有两种方法可以消除和减少这种误差。

尽量统一。

人口是我们要研究的未知事物,我们往往不可能改变它的均匀性。当我们能够使它达到理想的均匀性时,我们已经完全掌握了它,没有必要再去研究它。

确保抽样的代表性

采取适当的抽样方法保证抽样的代表性,可以有效地控制和提高统计推断的可靠性和正确性。

随机抽样的方法有很多,常见的有:

1,简单随机抽样

简单随机抽样是指抽样过程应独立进行,每个个体在总体中被抽取的机会是均等的。随机抽样不是随机抽样,随机抽样容易受个人好恶的影响。为了实现随机化,我们可以抽签、掷骰子或查随机数字表。如果从100个产品中随机抽取l0个产品组成一个样本,可以从L到100对这100个产品进行编号,然后通过抽签随机抽取l0个号码,这l0个号码所代表的产品组成一个样本。这种抽样方法的优点是抽样误差小,程序复杂。在实践中,要真正做到每个个体被抽到的机会均等,并不容易。

2.周期性系统抽样

周期性系统抽样,也称等距抽样或机械抽样,是对总体进行顺序编号,通过抽签或查随机数字表确定第一块,然后按照等距抽样的原则依次抽取样本。如果从120个零件中抽取5个样本,先按生产顺序对产品进行编号,用简单随机抽样法确定第一个零件,然后每24个编号抽取1个(从120÷5=24),* * *抽取5个样本。这种方法特别适用于在线采样,简单易操作,实施起来不易出错。但是一旦确定了抽样的起点,整个样本就完全固定了。总体质量特性存在一定的周期性变化,当抽样间隔与质量特性的变化周期重合时,可能得到偏差较大的样本。

3.分层抽样方法

分层抽样法,即从一个可分为不同亚种群的种群中,按照规定的比例随机抽取不同层的个体。当同一产品由不同的设备、不同的环境生产时,由于条件不同,产品的质量可能会有很大的差异。为了使取样的样品具有代表性,可以对不同条件下生产的产品进行分组,使同一组的产品质量一致,然后按比例随机抽取每组中的样品,合成一个样品。这种采样方法得到的样本具有代表性,采样误差小。缺点是取样程序复杂,通常用于产品质量检验。

4.整群抽样方法

在这种方法中,将种群按一定方式分成若干组,然后随机选取若干组,样本由这些组中的所有个体组成。比如按照生产流程,1000个零件放入20个箱子,每个箱子装50个零件,然后随机抽取一个箱子,这个箱子里的50个零件构成一个样本。这种抽样方法实施方便,但样本来自个体群体,不能在总体中均匀分布,代表性差,抽样误差大。