资源描述
统计
看一看
【知识回忆】
1.总体和样本
总体:在统计学中 , 把研究对象全体叫做总体.
个体:把每个研究对象叫做个体.
总体容量:把总体中个体总数叫做总体容量.
为了研究总体 有关性质,一般从总体中随机抽取一局部研究,我们称它为样本.其中个体个数称为样本容量。
2.简单随机抽样常用方法:
〔1〕抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
3.系统抽样〔等距抽样或机械抽样〕:
把总体单位进展排序,再计算出抽样距离,然后按照这一固定抽样距离抽取样本。第一个样本采用简单随机抽样方法抽取。
K〔抽样距离〕=N〔总体规模〕/n〔样本规模〕
4.分层抽样〔类型抽样〕:
先将总体中所有单位按照某种特征或标志〔性别、年龄等〕划分成假设干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样方法抽取一个子样本,最后,将这些子样本合起来构成总体样本。
5.用样本数字特征估计总体数字特征
〔1〕样本均值:
〔2〕样本标准差:
6.两个变量线性相关
〔1〕概念:回归直线方程、回归系数
〔2〕最小二乘法
〔3〕直线回归方程应用
〔1〕描述两变量之间依存关系;利用直线回归方程即可定量描述两个变量间依存数量关系
〔2〕利用回归方程进展预测;把预报因子〔即自变量x〕代入回归方程对预报量〔即因变量Y〕进展估计,即可得到个体Y值容许区间。
〔3〕利用回归方程进展统计控制规定Y值变化,通过控制x范围来实现统计控制目标。
想一想
应用直线回归考前须知有哪些?
练一练
1.如图是某样本数据茎叶图,那么该样本数据茎叶图,那么该样本数据中位数〔 〕
A.22 B.25 C.28 D.31
2.某学院有个饲养房,分别养有只白鼠供实验用.某项实验需抽取只白鼠,你认为最适宜抽样方法是〔 〕
A.在每个饲养房各抽取只
B.把所有白鼠都加上编有不同号码颈圈,用随机抽样法确定只
C.从个饲养房分别抽取只
D.先确定这个饲养房应分别抽取只,再由各饲养房自己加号码颈圈,用简单随机抽样方法确定
3.某大学数学系共有本科生4500人,其中大一、大二、大三、大四学生人数比为,假设用分层抽样方法从该系所有本科生中抽取一个容量为260样本,那么应抽大二学生〔 〕
A.80人 B.60人 C.40人 D.20人
4.从学号为~高一某班名学生中随机选取名同学参加体育测试,采用系统抽样方法,那么所选名学生学号可能是
A. B. C. D.
5.某工厂对一批产品进展了抽样检测.如图是根据抽样检测后产品净重〔单位:克〕数据绘制频率分布直方图,其中产品净重范围是96,106],样本数据分组为96,98〕,98,100〕,100,102〕,102,104〕,104,106],样本中产品净重小于100克个数是36,那么样本中净重大于或等于98克并且小于104克产品个数是〔 〕
A.90 B.75 C.60 D.45
6.为研究变量和线性相关性,甲、乙二人分别作了研究,利用线性回归方法分别得到回归直线方程和,两人计算一样,也一样,那么以下正确是〔 〕
A.与重合 B.与一定平行
C.与相交于点 D.无法判断和是否相交
7.一组数据中每一个数据都乘以2,再减去,得到一组新数据,假设求得新数据平均数是,方差是,那么原来数据平均数和方差分别是________.
8.某城市近10年居民年收入与支出之间关系大致符合〔单位:亿元〕,预计今年该城市居民年收入为20亿元,那么年支出估计是 亿元.
9.在样本频率分布直方图中,共有个小长方形,假设中间一个长方形面积等于其他个小长方形面积和,且样本容量为,那么中间一组频数为________.
10.从高三抽出名学生参加数学竞赛,由成绩得到如下频率分布直方图.试利用频率分布直方图求:
〔1〕这名学生成绩众数与中位数;
〔2〕这名学生平均成绩.
11.农科院专家为了了解新培育甲、乙两种麦苗长势情况,从甲、乙两种麦苗试验田中各抽取株麦苗测量麦苗株高,数据如下:〔单位:cm〕.
甲:
乙:.
〔1〕在给出方框内绘出所抽取甲、乙两种麦苗株高茎叶图;
〔2〕分别计算所抽取甲、乙两种麦苗株高平均数与方差,并由此判断甲、乙两种麦苗长势情况.
12.某种产品广告费支出与销售额〔单位:百万元〕之间有如下对应数据:
〔1〕画出散点图;
〔2〕求线性回归方程;
〔3〕试预测广告费支出为10百万元时,销售额多大?
【参考答案】
统计
想一想
(1) 做回归分析要有实际意义;
〔2〕回归分析前,最好先作出散点图;
〔3〕回归直线不要外延。
练一练
1.B
【解析】
试题分析:由茎叶图可知,该样本共有 11 个数据,按照从大到小顺序排列,中间数是 25,所以该样本数据中位数是 25.应选 B.
考点:茎叶图特征;中位数. 2.D
【解析】
试题分析:因为这 24 只白鼠要从 4
虽然用了分层抽样,但在每个层中没有考虑到个体差异,也就是说在各个饲养房中抽取样本时,没有说明是否具有随机性,应选 D.
考点:抽样
3.A
【解析】
试题分析:设抽取大二学生为 n \
n
=
4
\ n = 80
+ 4
+ 3 +1
260 5
考点:分层抽样
4.B
【解析】试题分析:系统抽样时每组 10 名学生,因此抽取编号构成以 10 为公差等差数列,因此 B 正确考点:系统抽样
6.C
【解析】
试题分析::∵两个人在试验中发现对变量 x 观测数据平均值都是 s,对
变量 y 观测数据平均值都是 t,∴两组数据样本中心点是 (x , y )∵回归
直线经过样本中心点,∴ l1 与 l2 都过 (x , y )
考点:线性回归方程
7.
试题分析::∵某城市近 10 年居民年收入 x 和支出 y 之间关系大致是y=0.9x+0.2,
∵x=20,∴y=0.9×20+0.2=18.2〔亿元〕.
考点:回归分析
9.32
【解析】
试题分析:设中间一个长方形面积为 S ,那么 S = 14 (1 - S) ,S = ,即中间一组频率为 0.2,频数为160 ´ = 32 ..
考点:频率分布直方图.
10.〔1〕75,76.7;〔2〕74
【解析】
试题分析:〔1〕由众数概念可知,众数是出现次数最多数.在直方图中高度最高小长方形框中间值横坐标即为所求;由于中位数是所有数据中中间值,故在频率分布直方图中表达是中位数左右两边频数应相等,即频率也相等,从而就是小矩形面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形面积一分为二直线所对应成绩即为所
求.〔2〕样本平均值应是频率分布直方图“重心〞,即所有数据平均值,取每个小矩形底边中点值乘以每个小矩形面积即可.
度最高小长方形框中间值横坐标即为所求,所以众数应为 75由于中位数是所有数据中中间值,故在频率分布直方图中表达是中位数
在频率分布直方图中将频率分布直方图中所有小矩形面积一分为二直线
所对应成绩即为所求.
∵ 0.004´10 + 0.006´10 + 0.02´10 = 0.04 + 0.06 + 0.2 = 0.3 .
∴前三个小矩形面积和为 ,而第四个小矩形面积为
0.03´10 = 0.3,0.3 + 0.3 > 0.5 ,
∴中位数应位于第四个小矩形内.
设其底边为 x ,高为 ,∴令 x = 得 x = ,故中位数约为
70 + 6.7 = 76.7 .
〔2〕样本平均值应是频率粉绿分布直方图“重心〞,即所有数据平均值,
取每个小矩形底边中点值乘以每个小矩形面积即可,
∴平均成绩为
45 ´ (0.004 ´10) + 55 ´ (0.006 ´10) + 65 ´ (0.02 ´10) + 75 ´ (0.03 ´10) + 85 ´ (0.021´10) + 95 ´ (0.016 ´10) = 74
考点:众数、中位数、平均数
11.〔1〕见解析;〔2〕甲种麦苗长较为整齐
【解析】
试题分析:〔1〕根据数据作出对应茎叶图;〔2〕根据平均数和方差公式,
展开阅读全文