收藏 分销(赏)

统计知识点及常见题型.doc

上传人:精**** 文档编号:9749771 上传时间:2025-04-06 格式:DOC 页数:9 大小:127.50KB 下载积分:6 金币
下载 相关 举报
统计知识点及常见题型.doc_第1页
第1页 / 共9页
统计知识点及常见题型.doc_第2页
第2页 / 共9页


点击查看更多>>
资源描述
统计知识点及常见题型 2.1.1简单随机抽样 1.总体和样本:在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本.其中个体的个数称为样本容量. 2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 3.简单随机抽样常用的方法: (1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。 在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。 4.抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签 (3)对样本中的每一个个体进行测量或调查 例:请调查你所在的学校的学生做喜欢的体育活动情况。 5.随机数表法: 例:利用随机数表在所在的班级中抽取10位同学参加某项活动。 2.1.2系统抽样 1.系统抽样(等距抽样或机械抽样): 把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)(总体规模)(样本规模) 前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。 2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。 2.1.3分层抽样 1.分层抽样(类型抽样): 先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 两种方法: 1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。 2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。 2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。 分层标准: (1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 (2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。 (3)以那些有明显分层区分的变量作为分层变量。 3.分层的比例问题: (1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 (2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 2.2.2用样本的数字特征估计总体的数字特征 1、样本均值: 2、.样本标准差: 3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。 4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍 (3)一组数据中的最大值和最小值对标准差的影响,区间的应用; “去掉一个最高分,去掉一个最低分”中的科学道理 2.3.2两个变量的线性相关 1、概念: (1)回归直线方程 (2)回归系数 2.回归直线方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中2的浓度。 4.应用直线回归的注意事项 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。 题型一选择合适的抽样方法 简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位 系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 1.现有以下两项调查:①某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共1500家,三者数量之比为1∶5∶9.为了调查全市商店每日零售额情况,抽取其中15家进行调查. 完成①、②这两项调查宜采用的抽样方法依次是( ) A.简单随机抽样法,分层抽样法 B.分层抽样法,简单随机抽样法 C.分层抽样法,系统抽样法 D.系统抽样法,分层抽样法 2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习负担情况,记作②;那么,完成上述2项调查应采用的抽样方法是( ) A.①用随机抽样法,②用系统抽样法 B.①用分层抽样法,②用随机抽样法 C.①用系统抽样法,②用分层抽样法 D.①用分层抽样法,②用系统抽样法 题型二:系统抽样剔除个体数计算 当系统抽样中样本总量除以样本容量不是整数时,需要用简单随机抽样法剔除部分个体,剔除个体的数量=样本总量—组距×样本容量。 例.若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应 从总体中随机剔除 个个体,编号后应均分为 段,每段有 个个体.5, 35 ,47 题型三:分层抽样有关计算 分层抽样特点:各层抽样比例=总体抽样比例=,每层抽取个体数量=该层个体总量×抽样比例。 经典例题:某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少学生? 练习.某单位业务人员、管理人员、后勤服务人员人数之比依次为15∶3∶2.为了了解该单位职员的某种情况,采用分层抽样方法抽出一个容量为n的样本,样本中业务人员人数为30,则此样本的容量n为( ) A.20 B.30 C.40 D.80 题型四:频率分布直方图画法步骤 作频率分布直方图分布的步骤 ⑴求极差(即一组数据中最大值与最小值的差) ⑵决定组距与组数,一般样本容量越大组数越多,经常分为5~12组,组距尽量取整。 ⑶将数据分组,通过唱票计算各组的频数 ⑷列频率分布表,根据各组频数计算频率,列出频率分布表 ⑸画出频率分布直方图,横轴只画最小值与最大值之间部分,纵轴表示的值 题型五:由频率分布直方图估计众数、平均数、中位数 ⑴由频率分布直方图估计众数:一般先计算各部分小矩形的面积,找到面积最大的矩形,取该矩形横边中点对应的数即为所求 ⑵由频率分布直方图估计平均数:一般利用平均数公式来计算,其中表示第n个矩形横边中点对应的数,表示第n个矩形的面积。 ⑶由频率分布直方图估计中位数:就是平分直方图面积且垂直于横轴的直线对应的数。前n个小矩形面积不足0.5时, 中位数=下一个矩形横边左端点+×组距 题型六:频率分布表中未知量计算 各组频数之和=样本容量,各组频率之和=1,各组频数÷频率=样本容量 数据落在某区间的概率≈区间包括的各组频率之和 经典例题:为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5. 频率 组距 次数 49.5 74.5 99.5 124.5 149.5 (1) 求第四小组的频率和参加这次测试的学生人数;(2) 在这次测试中,学生跳绳次数的中位数落在第几小组内?(3) 参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少? ⑷试估计该年级学生平均跳绳次数,中位数、众数 练习一.2005年降雨量的概率如下表所示: (1)求年降雨量在 范围内的概率;(2)求年降雨量在或范围内的概率; (3)求年降雨量不在范围内的概率;(4)求年降雨量在范围内的概率. 年降雨量 概率 0.12 0.25 0.16 0.14 练习2.某地区的年降水量在下列范围内的概率如下表所示 年降水量(单位:) [100,150) [150,200) [200,250) [250,300) 概率 0.12 0.25 0.16 0.14 则年降水量在[150,300]()范围内的概率为(   ) A.0.41 B.0.45 C.0.55 D.0.67 练习3.(2014重庆文17)(本小题满分13分.(I)小问4分,()小问4分,()小问5分) 20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示: 洞穿高考预测题六 (I)求频率分布直方图中的值; ()分别求出成绩落在与中的学生人数; ()从成绩在的学生中任选2人,求此2人的成绩都在中的概率. 题型七:用平均数和方差判断产品质量、成绩好坏、产量高低等 平均数和方差(标准差)都是反映数据离散程度的工具。成绩好坏、产量高低等指标首先看平均数越高越好,当平均数相近或相同时,可以用方差(标准差)来刻画样本的稳定性。 题型八:求线性相关的两个变量的回归直线方程,并作出适当预测 ①第一步:作散点图 第二步:求回归方程 第三步:代值计算 求线性回归方程系数公式:,. 重要结论⑴正相关则b>0,负相关则b<0,当解释变量增加一个单位时,预报变量相应增加(b>0)或减少(b<0)︳b︴个单位 ⑵,称为样本点的中心,此点一定在回归直线上。 ⑶用回归直线方程计算出的y值不是真实值,真实值在计算值的左右,可能大,可能小也可能相等。 ⑷相关指数R2用来刻画拟合效果,R2的值越大,拟合效果越好,反之则越差,一般选择R2值大的模型。 ⑸对R2值理解:相关指数R2≈0.997,说明x可以解释y的99.7%的变化。 经典例题:10.有10名同学高一(x)和高二(y)的数学成绩如下: 高一成绩x 74 71 72 68 76 73 67 70 65 74 高二成绩y 76 75 71 7 72 ⑴画出散点图; ⑵求y对x的回归方程。⑶预测高一数学成绩82分的同学数学成绩。 练习.假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料: 2 3 4 5 6 2.2 3.8 5.5 6.5 7.0 若由资料知,y对x呈线性相关关系,试求: (Ⅰ)请画出上表数据的散点图; (Ⅱ)请根据上表提供的数据,求出y关于x的线性回归方程; (Ⅲ)估计使用年限为10年时,维修费用约是多少? () 9 / 9
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服