1、1.检验的显著性水平:在假设检验中,若小概率事件的概率不超过,则称为检验水平或显著性水平。检验的P值:拒绝原假设的最小显著水平称为假设检验中的P值。2.参数估计的类型: 点估计; 区间估计;参数的点估计的方法: 矩估计法 基本思想:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。因此,只要总体X的k阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。 极大似然估计法 基本思想:设总体分布的函数形式已知,但有未知参数,可以取很多值,有的一切可能取值中选一个使样本观察值出现的概率为最大的值作为的估计值,记作
2、,并称为的极大似然估计值。这种求估计值的方法称为极大似然估计法。参数的点估计的评价方法:无偏性;有效性;一致性。3.假设检验的思想:先假设总体具有某种特征,然后再通过对样本的加工,即构造统计量推断出假设的结论是否合理。假设检验是带有概率性质的反证法。推理依据:第一,假设检验所采用的逻辑推理方法是反证法。第二,合理与否,所依据的是“小概率事件实际不可能发生的原理”。参数假设检验步骤:提出原假设和备择假设;选择适当的统计量,并确定其分布形式;选择显著性水平 ,确定临界值;作出结论。5.正交试验数据分析方法:直接对比法就是对试验结果进行简单的直接对比。直观分析法是通过对每一因素的平均极差来分析问题。
3、所谓极差就是平均效果中最大值和最小值的差。有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。4.方差分析的目的:方差分析的目的是通过分析,判定某一因子是否显著,当因子显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。方差分析是对多个总体均值是否相等这一假设进行检验。思想:检验1=2=是通过方差的比较来确定的,即:要考虑均值(观测值)之间的差异,差异的产生来自两个方面,一方面是由因素中的不同水平造成的,称为系统性差异;另一方面是由随机性而产生的差异。两方面的差异用两个方差来计量,一个称为水平之间的方差(既包括系统性因素,也包括随机性因素);一个称为水平
4、内部的方差(仅包括随机性因素)。如果不同的水平对结果没有影响,两个方差的比值会接近于1(即H0为真);反之,如果不同水平对结果产生影响,两个方差的比值会显著地大于1许多,认为H0不真,可作出判断,说明不同水平之间存在着显著性差异。如果方差分析只对一个因素进行称为单因素方差分析。单因素方差分析所讨论的是在个总体标准差皆相等的条件下,解决个总体平均数是否相等的问题。6.主成分分析答:主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量
5、的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。7. 典型相关分析:的基本思想典型相关分析是主成分分析和因子分析的进一步发展,是研究两组变量间的相互依赖关系,把两组变量之间的相互关系变为研究两个新的变量之间的相关,而且又不抛弃原来变量的信息,这两个新的变量分别由第一组变量和第二组变量的线性组合构成,并且两组变量的个数可以是不同的,两组变量所代表的内容也可以是不同的。8.贝叶斯判别法:如果对多个总体的判别考虑的不是建立判别式,而是计算新给样品属于各总体的条件概率,l=1,k。比较这k个概率的大小,然后将新样品判归为来自各概率最大的总体,这种判别法称为Bayes
6、判别法。Bayes判别法的基本思想总是假定对所研究的对象已有一定的认识,常用先验概率来描述这种认识。9. 聚类:聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照它们在性质上的亲疏程度进行分类。距离的种类很多,其中欧式距离在聚类分析中用得最广,它的表达式中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。分类:的方法很多,系统聚类法是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合
7、并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。10.线性回归分析的主要内容及应用中注意的问题。答:回归分析主要用于回答一些定义明确的度量单位的数值变量之间的关系问题。回归分析通过一个变量或一些变量的变化解释另一变量的变化。其主要内容和步骤是:首先根据理论和对问题的分析判断,将变量分为自变量和因变量;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。回归有不同种类,按照自变量的个数分,
8、有一元回归和多元回归。只有一个自变量的叫一元回归,有两个或两个以上自变量的叫多元回归;按照回归曲线的形态分,有线性(直线)回归和非线性(曲线)回归。实际分析时应根据客观现象的性质、特点、研究目的和任务选取回归分析的方法。11.系统聚类法的基本思想是:首先是n个样本各自成一类,然后规定类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。系统聚类法的步骤如下:用数字描述样本的特征。规定样本之间的相似系数rij(0rij1;i,j1,n)。运用合成运算R2RR(或R4R2R2等)求出
9、最接近相似关系R的模糊等价关系SR2(或R4等)。选取适当水平(01),得到X 的一种聚类。12. 如何看待多元统计方法在实际数据处理中的作用与地位。答:多元统计方法起源于20世纪20年代,50年代后随着计算机和统计分析软件的发展,得到广泛应用,逐步渗透到自然科学和社会科学的各个领域。多元统计是研究多个变量之间相互依赖关系以及内在统计规律性的一门统计学科,其技术可以分为非对称性技术和对称性技术。利用多元分析中不同的方法可以对研究对象进行分类和简化。在当前科技和经济迅速发展的今天,在国民经济许多领域中特别对社会经济现象的分析,只停留在定性分析上往往是不够的。为提高科学性,可靠性,通常需要定性与定量分析相结合。实践证明,多元分析是实现定量分析的有效工具。2