1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date电大社会统计学期末考试简答题与计算题复习资料必备参考答案(1)5电年夜社会统计学复习材料参考答案简答题1、统计数据的质量要求:1、精度:最低的抽样误差或随机误差; 2、切确性:最小的非抽样误差或误差;3、联系关系性:知足用户选择妄想、打点和争辩的需要;4、实时性:在最短的时刻里取得并发布数据;5、一 致 性:连结时刻序列的可比性; 6、最低成本:以最经济的体例取得数据
2、。2、抽样误差及其影响身分:1、由于抽样的随机性所带来的误差; 2、全部样本可能的功效与总体真值之间的平均性差异; 3、影响抽样误差的巨细的身分:样本量的巨细,总体的变异性。3、判定计量口角的评判尺度:用样本的估量量直接作为总体参数的估量值,无偏性:估量量抽样分布的数学期望等于被估量的总体参数 ;有用性:对统一总体参数的两个无偏点估量量,有更小尺度差的估量量更有用; 全都性:跟着样本容量的增年夜,估量量的值越来越接近被估量的总体参数。4、假设磨练的一般轨范:(1)陈述原假设和备择假设;(2)从所争辩的总体中抽出一个随机样本;(3)确定一个恰当的磨练统计量,并操作样本数据算出其具体数值;(4)确
3、定一个恰当的显著性水平,并计较出其临界值,指定拒绝域;(5)将统计量的值与临界值进行斗劲,作出选择妄想;(6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。5、假设磨练中的两类错误及其之间的关系错误:1、第类错误(弃真错误)原假设为真时拒绝原假设,第类错误的概率记为a,即显著性水平;2、第类错误(取伪错误)原假设为假时未拒绝原假设,第类错误的概率记为b。a和b的关系就像翘翘板,a小b就年夜,a年夜b就小。是以,在样本容量n固定情形下,不能同时削减两类错误!一般接受增加样本容量的法子来解决。关系:当显著性水平a减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是接管域增年夜了,是以纳伪的
4、概率b要增年夜。反之亦然(P235)。也就是说若是要减小b,就增年夜显著性水平a。6、置信区间与置信度的关系表达式:称作置信区间。称作置信度,可托度,或置信水平。称置信水平。在样本容量必定的情形下,置信区间和置信度是彼此制约的。置信度愈年夜,则响应的置信区间也域宽。当把区间估量得小一些,估量的切确水平提高了,但换取的价钱将是估错的可能性增加了,也就是靠得住性或置信度下降了。(P201)7、正态分布曲线的特征:()一个岑岭:曲线是单峰,有一个最高点。()一个对称轴。曲线的岑岭处有一个对称轴,在轴的摆布双方是对称的。()一个渐近线。曲线无论向左或向右延长,都愈来愈接近横轴,但不会和横轴订交,以横轴
5、为渐近线。4.正态分布一般用示意。(P139)8、方差剖析的根基假定:(二)e的分布为正态分布要求每一个Ai所对应yi的分布都呈正态。总结起来,进行方差剖析,要求总体中每一个自变量的取值对应的因变量yi知足正态分布9、方差剖析的根基事理和规律:根基事理:变异的可加性。依据这一事理,将数据的总变异分化为分歧来历的变异(组间、组内),依据分歧来历的变异在总变异中所占的比重对造成数据变异的缘由作出诠释。10、非参数磨练的优错误谬误:利益:没有严酷的前提假设,对总体分布无需加以限制,计较劲也斗劲少。错误谬误:在齐截情形下,磨练的效率较差。未能充实操作资料的全数信息,今朝还不能措置交互浸染。(清算人:燕
6、梅 我会清算小组工作,其他科目有同窗清算的请巨匠一路共享下哈这样巨匠备考城市更有用)。其他常识点u 随机现象:事先无法确定会呈现那种功效的现象总体:所争辩的全数元素的集结,其中的每一个元素称为个体,分为有限总体和无限总体。样本:从总体中抽取的一部门元素的集结,组成样本的元素的数目称为样本容量。参数:争辩者想要体会的总体的某种特征值。统计量:依据样本数据计较出来的一个量。u 变量:声名现象某种特征的概念。分类变量:声名事物类此外一个名称。挨次变量:声名事物有序类此外一个名称。数值型变量:声名事物数字特征的一个名称。离散变量:取有限个值; 持续变量:可以去无限多个值。u 普查:为特定目的特地组织的
7、非经常性周全查询访问。典型查询访问:从查询访问对象的全数单元中选择少数典型单元进行查询访问。重点查询访问:从查询访问对象的全数单元中选择少数重点单元进行查询访问。u 数据质量的要求误差:测量值与真实值之间的差异。随机误差:在统一前提下,对统一量值进行多次测量时,其数值和符号以不成预见的体例而转变的那部门误差。系统误差:在必定的测量前提下,对统一被测物进行多次一再测量时,误差值的巨细和符号连结不变,或者在前提转变时,按必定纪律转变的误差。抽样误差:由于抽样的随机性所带来的误差。非抽样误差:除抽样误差之外的,由于其他缘由造成的样本不雅察算作果与总体真值之间的差异。u 分类数据的清算(指标)与图形频
8、数:落在各类别中的数据个数。比例:某一类别数据占全数数据的比值,可以斗劲分歧样本。百分比:将对比的基数作为100而计较的比值。比率:把计较比例时所用的基数变年夜,如100、1000、10000等,最常用的是百分比率。对比值:分歧类别数值的比值。挨次数据的清算与显示:累积频数、累积频率数值型数据的清算 组限统计表设计的要求:3W要求 which when what 、集中趋向测量及计较、三者的斗劲及应用。u 离散水平的测量及运用计较:题1:甲乙两同窗分袂来自一班级某班和二班级某班,某次期末考试,两同窗均考了80分,一班的平均分为80分,尺度差为10,二班的平均分为70分,尺度差为10,这两个同窗
9、在班级上的成就是否一样?题2:政治物理甲7060乙6070政治平均分为70,尺度差为10,物理平均分为50,尺度差为10。甲乙两人的总成就是否不异?u 尺度正态分布(表)的应用:(见P151)u 抽样查询访问的体例:简洁随机抽样,分为一再抽样、不一再抽样;等距抽样(机械抽样、系统抽样);分层抽样(类型抽样、分类抽样),依据各层抽取比例是否相等,可分作定比抽样和异比抽样。u 抽样误差:即指样本估量值与总体参数之间的差异,例如样本平均值X与总体均值u之差。u 参数估量:(见PPT)u 回归、相关与假设磨练:(见P333或PPT)u 方差剖析:是剖析或磨练总体间的均值是否有所分歧,而不是方差是否有所分歧,但其 磨练所用的体例或手段则是经由过程方差来进行的。方差剖析分一元方差剖析、二元方差剖析以及多元方差剖析。u 非参数磨练(P416):就是指“对分布类型已知总体、进行参数磨练”之外,全部磨练体例的总称。 利益:对总体分布无须加以限制,计较劲也斗劲少,简洁易行; 错误谬误:磨练的效率较差(费参数磨练法一般要比用响应的参数磨练需要较年夜的样本)。精品电年夜复习资料6