资源描述
《数据的收集与整理》考点例析
《数据的收集与整理》一章总的来说有以下几个方面的内容:全面调查与抽样调查;总体、个体、样本;数据的收集与整理及描述。下列谈谈本章的几个考点:
考点1 全面调查和抽样调查
数据的收集方式有两种:全面调查(也叫做普查)和抽样调查。怎样选择采用哪种调查方式要根据具体情境的要求选用适当的方式才是解决问题的宗旨。一般来说,当要求全面了解数据且总体的个数较少,或受客观条件的限制,无法进行全面调查,或调查具有破坏性不允许全面调查,这时可采用抽样调查的方式进行。
例1 下面调查统计中,适合做普查的是( ).
(A)雪花牌电冰箱的市场占有率
(B)蓓蕾专栏电视节目的收视率
(C)飞马牌汽车每百公里的耗油量
(D)今天班主任张老师与几名同学谈话
析解:仔细分析考题提供的四种考查对象,不难推断出:A、B、C分别考查电冰箱的市场占有率、电视节目的收视率、汽车每百公里的耗油量,由于它们考查的对象数量大,一般这种情况应采用抽样调查的方式,D针对一个班而言,其人数有限,故应采取普查的方式.选D
考点二 抽样调查的合理性
抽样调查时,调查数据要真实可信,样本的选取要注意两性:即调查对象不能太少,要有一定的广泛性;调查对象是随机抽取的,且具有代表性。
例2 某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是 ( ).
A.在公园调查了1000名老年人的健康状况
B.在医院调查了1000名老年人的健康状况
C.调查了10名老年邻居的健康状况
D.利用派出所的户籍网随机调查了该地区10%的老年人的健康状况
解析 选项A和选项B不具有代表性,因为到公园的老年人一般都是喜欢锻练的,他们的身体素质一般都好,到医院的老年人的健康一般不算太好;选项C,调查了10名老年,调查不具有代表性和广泛性;故选D。
考点三 总体和样本
在统计里,我们把所需要考查的对象的全体叫做总体,其中的每一个考查对象叫做个体,从总体中所抽取的一部分个体叫总体的一个样本。
例3 刘强同学为了调查全市初中生人数,他对自己所在城区人口和城区初中生人数作了调查:城区人口约3万,初中生人数约1200.全市人口实际约300万,为此他推断全市初中生人数为12万.但市教育局提供的全市初中生人数约8万,与估计数据有很大偏差.请你用所学的统计知识,找出其中错误的原因____
解析:错误的原因可能是样本在总体中所占比例太小;或样本不具代表性、广泛性、随机性;只要答对其中一项即可。
考点四 数据的整理
收集数据的一般的过程是①明确调查的问题;②确定调查对象;③选择调查方法;④实施调查;⑤记录结果――采用划记法;⑥得出结论。
收集好了数据后需要整理,那么如何进行整理呢?
为了更清楚地了解调查结果,需要对数据进行整理,一般可以用表格整理数据。表格上方一般要有表头。表格通常由行和列组成。在表中我们一般用划“正”字,“正”的每一划(笔画)代表一个数据。统计表格可以设计成不同式样,但要简单、清楚、有利于突出数据的分布规律。
例4 2008年奥运会在北京举行,南宁市某校学生会为了了解全校同学喜欢收看奥运会比赛项目的情况,随机调查了200名同学,根据调查结果制作了频数分布表:
(1)补全频数分布表;
(2)在这次抽样调查中,最喜欢收看哪个奥运会比赛项目的同学最多?最喜欢收看哪个比赛项目的同学最少?
(3)根据以上调查,试估计该校1800名学生中,最喜欢收看羽毛球比赛的人数.
最喜欢收看的项目
频数(人数)
频率
足球
篮球
56
排球
20
羽毛球
34
乒乓球
20
游泳
跳水
18
田径
8
合计
200
解:(1)足球的频数是32,游泳的频数是12,游泳的频率是6%(或0.06),
合计的频率是(或1)(2)篮球最多,田径最少
(3)(人)
考点五 数据的描述
数据整理后为了更具体直观地看出统计表格中的信息,还可以画出条形统计图、扇形统计图和折线统计图来描述数据。
条形统计图能清楚地表示出每个项目中的具体数目;扇形统计图能清楚表示出各部分在整体中所占的百分比;折线统计图既可以表示出项目的具体数量,又能清楚地反映事物的变化情况。
例5 某学校为丰富大课间自由活动的内容,随机选取本校100名学生进行调查,调查内容是“你最喜欢的自由活动项目是什么?”,整理收集到的数据,绘制成下图。
(1)学校采用的调查方式是_______________;
(2)求喜欢“踢毽子”的学生人数,并在图1中将“踢毽子”部分的图形补充完整;
(3)该校共有800名学生,请估计喜欢“跳绳”的学生人数。
5
10
15
20
人数
30
25
40
35
0
跳绳
躲避球
踢毽子
其
图1
自由活动项目
解:(1)抽样调查;
(2)(人).
0
5
10
15
20
25
30
35
40
躲避球
跳绳
踢毽子
其他
自由活动项目
人数
图2
答:喜欢“踢毽子”的学生人数为25人.
如图2;
(3)(人)
答:估计学校喜欢“跳绳”的学生有160人.
例6 据2009年5月26日《生活报》报道,我省有关部门要求各中小学要把“每天锻炼一小时”写入课表.为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图3是根据这组数据绘制的条形统计图.请结合统计图回答下列问题:
(1)该校对多少名学生进行了抽样调查?
(2)本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?
(3)若该校九年级共有200名学生,图4是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?
图4
六年级
30%
七年级
24%
八年级
26%
九年级
图3
最喜欢的体育活
动项目的人数/人
最喜欢的体
育活动项目
羽毛球
跳绳
足球
篮球
其他
0
4
8
10
18
解:(1)由图3知:(名)
答:该校对50名学生进行了抽样调查.
(2)本次调查中,最喜欢篮球活动的有18人,
最喜欢篮球活动的人数占被调查人数的.
(3) (人)
(人)
答:估计全校学生中最喜欢跳绳活动的人数约为160人.
例7 第8中学的九年级学生在社会实践中,调查了500位市民某天早上出行上班所用的交通工具,结果用扇形统计图5表示.
(1)请你将这个统计图改成用折线统计图表示的形式;
(2)请根据此项调查,对城市交通给政府提出一条建议.
0
50
100
150
200
250
300
步行
自行车
电动车
公交车
私家车
交通工具
人数
500位杭州市民出行的交通工具折线统计图
图6
图5
解:(1)折线统计图如图6:
(2)诸如实行公交优先;或宣传步行有利健康等.
直方图与中考题
在信息时代,我们会遇到各种不同的数据信息.这就要求我们不仅会收集、整理数据信息.而且还要能对数据进行分析、加工,进一步作出判断和决策.和数据处理相关的频数分布直方图是学习的一个重点.下面就有关的题型分析如下.
一、从直方图中获取信息
例1国家规定“中小学生每天在校体育活动时间不低于1小时”.为此,某市就“你每天在校体育活动时间是多少”的问题随机调查了辖区内300名初中学生.根据调查结果绘制成的统计图(部分)如图1所示,其中分组情况是:
140
120
100
80
60
40
20
A
B
C
D
组别
人数
图 1
A组:; B组:
C组: D组:
请根据上述信息解答下列问题:
(1)C组的人数是 ;
(2)本次调查数据的中位数落在 组内;
(3)若该辖区约有24 000名初中学生,请你估计其中达国家规定体育活动时间的人约有多少?
分析:掌握频数分布直方图的特点是解决问题的关键,从直方图可以看出,数据共分4组,每组的人数已知,其中B组的人数最多,D组第二,A组第三.
解:(1)120;
(2)C;
(3)达国家规定体育活动时间的人数约占.
所以,达国家规定体育活动时间的人约有(人).
点评:从已知的直方图中获取信息,需要注意观察直方图中共分成几个组,每组的数据的频数是多少,根据获取的数据信息,再进行相关的计算.
二、根据已知的数据信息画直方图
例2某中学为了培养学生的社会实践能力,今年“五一”长假期间要求学生参加一项社会调查活动.为此,小明在他所居住小区的600个家庭中,随机调查了50个家庭在新工资制度实施后的收入情况,并绘制了如下的频数分布表和频数分布直方图(收入取整数,单位:元).
分 组
频 数
频 率
1000~1200
3
0.060
1200~1400
12
0.240
1400~1600
18
0.360
1600~1800
0.200
1800~2000
5
2000~2200
2
0.040
合计
50
1.000
请你根据以上提供的信息,解答下列问题:
(1)补全频数分布表和频数分布直方图;
(2)这50个家庭收入的中位数落在 小组;
(3)请你估算该小区600个家庭中收入较低(不足1400元)的家庭个数大约有多少?
分析:画频数分布直方图的关键是根据数据信息进行适当分组,根据所分的组数列出频数分布表,根据频数分布表画频数分布直方图.
解:(1)10 , 0.100 ; 说明:补全直方图(频数为10).
(2)第三小组 1400~1600
(3)(0.060+0.240)×600=180 .
点评:根据所给的信息画频数分布直方图,需要计算最大值与最小值的差,确定组距和组数.然后列出频数分布统计表,最后根据表格中的信息,画出频数分布直方图.注意频数分布直方图和条形图不同.
从统计图中获取信息
表格、图象是一种最直观、形象的数学语言,包含着丰富的信息资源,利用这些信息来分析、解决问题,是近年中考命题居高不下的新热点。解答这类题目的关键是充分利用图表所蕴涵的信息,通过读图表、思图表、分析图表,把图表中的内容翻译成数学语言,然后正确解答。本文试以近年来中考试题为例,说明统计图信息题的求解策略,以飨读者。
1.从条形统计图中获取信息
例1(德州市中考题)振兴中学某班的学生对本校学生会倡导的“抗震救灾,众志成城”自愿捐款活动进行抽样调查,得到了一组学生捐款情况的数据.下图是根据这组数据绘制的统计图,图中从左到右各长方形的高度之比为3︰4︰5︰8︰6,又知此次调查中捐款25元和30元的学生一共42人.
(1)他们一共调查了多少人?
(2)这组数据的众数、中位数各是多少?
(3)若该校共有1560名学生,估计全校学生捐款多少元?
10
15
20
25
30
捐款数/元
人数
解析:这是一个条形统计图,在明白横轴、纵轴所表示的意义后,根据长方形的高度的比例3︰4︰5︰8︰6,又知此次调查中捐款25元和30元的学生一共42人,可构造一元一次方程求得每种捐款的人数。
(1)设捐款30元的有6x人,则8x+6x=42.
∴ x=3.
∴ 捐款人数共有:3x+4x+5x+8x+6x=78(人).
(2)由图象可知:众数为25(元);由于本组数据的个数为78,按大小顺序排列处于中间位置的两个数都是25(元),故中位数为25(元).
(3) 全校共捐款:
(9×10+12×15+15×20+24×25+18×30)×=34200(元).
练习1:某校320名学生在电脑培训前后各参加了一次水平相同的考试,考分都以同一标准划分成“不合格”、“合格”、“优秀”
三个等级。为了了解电脑培训的效果,随机抽取32名学生两次考试考
分等级的统计图(如图1)。试回答下列问题:
⑴这32名学生经过培训,考分等级“不合格”的百分比由__________下降到__________;
⑵估计该校320名学生,培训后考分等级为“合格”与
“ 优秀”的学生共___________名;
⑶你认为上述估计合理吗?理由是什么?
答:___________,理由:______________________________
2.从扇形统计图中获取
例2(白银等九市州中考题)张颖同学把自己一周的支出情况,用如图所示的统计图来表示.则从图中可以看出( )
A.一周支出的总金额
B.一周各项支出的金额
C.一周内各项支出金额占总支出的百分比
D.各项支出金额在一周中的变化情况
解析:扇形统计图是反映部分占整体的百分比.观察统计图知,此图表示一周内各项支出金额占总支出的百分比,故选C. 。此题,既考查了学生识图、读图的能力,又考查了学生描述数据——画图的能力,可谓“一箭双雕”。
练习2 如图表示某校七年级360位同学购买不同品牌计算器人数的扇形统计图,每位同学购买一只计算器.试回答下列问题:
(1)分别求出购买各品牌计算器的人数;
(2)试画出购买不同品牌计算器人数的频数分布直方图.
(2)(画出图形略)
3.从折线统计图题获取信息
例3(江西中考题)为了了解甲、乙两同学对“字的个数”的估计能力,现场对他们进行了5次测试,测试方法是:拿出一张报纸,随意用笔画一个圈,让他们看了一眼后迅速说出圈内有多少个汉字.但不同的是:甲同学每次估计完字数后不告诉他圈内的实际字数,乙同学每次估计完字数后告诉他圈内的实际字数.根据甲、乙两同学5次估计情况可绘制统计图如下:
20
偏差率(%)
第1次
15
10
5
0
第2次
第3次
第4次
第5次
次数
甲同学
乙同学
偏差率的计算公式:
.
例如,圈内实际字数为80,某同学估计的实际字数为65时,偏差率为.显然,偏差率越低,字数估计能力越强.
(1)观察、分析上图,写出三条不同类型的正确结论;
(2)若对甲、乙两同学进行第6次测试,
①请你用统计知识分别预测他们估计字数的偏差率(从一个角度预测即可)
②若所圈出的实际字数为100,请根据①中预测的偏差率推算出他们估计的字数所在的范围.
解析 (1)答案不惟一,例如:
①甲同学对字数的估计能力没有明显的提高,或乙同学经反馈后对字数的估计能力有明显提高;
②甲同学的偏差率最小值是,或乙同学的偏差率最小值是,或甲、乙两同学的偏差率最大值者是;
③从第二次开始,乙同学的偏差率都低于甲同学的偏差率,即从第二次开始,乙同学每次都比甲同学的估计更准确;
④甲同学的平均偏差率是,或乙同学的平均偏差率是;
⑤甲同学的偏差率的极差是,或乙同学的偏差率的极差是;等等.
(2)①对甲同学第6次偏差率的预测,答案不唯一,例如:
(i)从平均偏差率的角度预测,甲同学字数估计的偏差率是;
(ii)从偏差率的最大值与最小值的平均值预测,甲同学字数估计的偏差率是;
(iii)从偏差率的中位数角度预测,甲同学字数估计的偏差率是;等等.
对乙同学第6次偏差率的预测,答案不唯一,例如:
(i)从平均偏差率的角度预测,乙同学字数估计的偏差率是;
(ii)从偏差率的变化趋势预测,乙同学字数估计的偏差率在之间;
(iii)从偏差率的中位数角度预测,乙同学字数估计的偏差率是;等等.
②根据偏差率的计算公式,得
估计的字数=实际字数(实际数字偏差率).
当所圈出的实际字数为100时,可相应地推算出甲、乙估计的字数所在的范围.
对甲同学而言,相应地有
(i)从平均偏差率的角度预测,估计的字数所在的范围是84~116;
(ii)从偏差率的最大值与最小值的平均值预测,估计的字数所在的范围是:84~116或83~117;
(iii)从偏差率的中位数角度预测,估计的字数所在的范围是:85~115;等等. 8分
对乙同学而言,相应地有
(i)从平均偏差率的角度预测,估计的字数所在的范围是89~111;
(ii)从偏差率的变化趋势预测,估计的字数所在的范围是:96~104,或其它;
(iii)从偏差率的中位数角度预测,估计的字数所在的范围是:90~110;等等
练习3 观察市统计局公布的“十五”时期重庆市农村居民人均 收入每年比上一年增长率的统计图,下列说法正确的是( )
A.2003年农村居民人均收入低于2002年
B.农村居民人均收入比上年增长率低于9%的有2年
C.农村居民人均收入最多时2004年
D.农村居民人均收入每年比上一年的增
长率有大有小,但农村居民人均收入在持续增加。
4.从直方图中获取信息
例4(赣州中考题、请观察下图,并回答以下的问题:
(1)被检测的矿泉水的总数有 种;在矿泉水pH的频数分布直方图中,组界为6.9~7.3这一组的频数是 ,频率是 ;
(2)被检测的所有矿泉水pH的范围是 ~ ;
(3)根据我国2001年公布的生活饮用水卫生规范,饮用水的pH应在6.5~8.5的范围内.被检测的矿泉水不符合这一标准的有多少种?不合格率为多少?(精确到0.1%)
解析:从已画的直方图中易求出被检测的矿泉水的总数:(1)30;12,0.4;
(2)5.7~8.5(或填5.7~7.7与8.1~8.5也正确)
(3)不符合这一标准的有5种;
∴不合格率为:
练习4 要了解某地区八年级学生的身高情况,从中随机抽取
150名学生的身高作为一个样本,身高均在141cm~175cm之间(取整数厘米),整理后分成7组,绘制出频数分布直方图(不完整).根据图中提供的信息,解答下列问题:
(1) 补全频数分布直方图;
(2) 该地区共有3 000名八年级学生,估计其
中身高不低于161cm的人数.
身高/cm
140.5
145.5
150.5
155.5
160.5
165.5
170.5
175.5
10
20
30
40
50
0
学生数/人
48
9
18
27
15
6
5.从双统计图中获取信息
例5(北京中考题)为减少环境污染,自2008年6月1日起,全国的商品零售场所开始实行“塑料购物袋有偿使用制度”(以下简称“限塑令”).某班同学于6月上旬的一天,在某超市门口采用问卷调查的方式,随机调查了“限塑令”实施前后,顾客在该超市用购物袋的情况,以下是根据100位顾客的100份有效答卷画出的统计图表的一部分:
40
35
30
25
20
15
10
5
0
图1
1
2
3
4
5
6
7
4
3
11
26
37
9
塑料袋数/个
人数/位
“限塑令”实施前,平均一次购物使用不同数量塑料购物袋的人数统计图
“限塑令”实施后,使用各种
购物袋的人数分布统计图
其它
5%
收费塑料购物袋
_______%
自备袋
46%
押金式环保袋24%
图2
“限塑令”实施后,塑料购物袋使用后的处理方式统计表
处理方式
直接丢弃
直接做垃圾袋
再次购物使用
其它
选该项的人数占
总人数的百分比
5%
35%
49%
11%
请你根据以上信息解答下列问题:
(1)补全图1,“限塑令”实施前,如果每天约有2 000人次到该超市购物.根据这100位顾客平均一次购物使用塑料购物袋的平均数,估计这个超市每天需要为顾客提供多少个塑料购物袋?
(2)补全图2,并根据统计图和统计表说明,购物时怎样选用购物袋,塑料购物袋使用后怎样处理,能对环境保护带来积极的影响.
解析:(1)补全图1见下图.
40
35
30
25
20
15
10
5
0
图1
1
2
3
4
5
6
7
4
3
11
26
37
9
塑料袋数/个
人数/位
“限塑令”实施前,平均一次购物使用不同数量塑料购物袋的人数统计图
10
(个).
这100位顾客平均一次购物使用塑料购物袋的平均数为3个.
.
估计这个超市每天需要为顾客提供6000个塑料购物袋.
(2)图2中,使用收费塑料购物袋的人数所占百分比为.
根据图表回答正确给1分,例如:由图2和统计表可知,购物时应尽量使用自备袋和押金式环保袋,少用塑料购物袋;塑料购物袋应尽量循环使用,以便减少塑料购物袋的使用量,为环保做贡献.
练习5 我国政府规定:从2008年6月1日起限制使用塑料袋.5月的某一天,小明和小刚在本市的A、B、C三家大型超市就市民对“限塑令”的态度进行了一次随机调查.结果如下面的图表:
A、B、C三家超市共计
图9
超市
态度
A
B
C
合计
赞同
20
75
55
150
不赞同
23
17
无所谓
57
20
28
105
(1)此次共调查了多少人?
(2)请将图表补充完整;
(3)用你所学过的统计知识来说明哪个超市的调查结果更能反映消费者的态度.
练习参考答案
1、【解答】:(1)、; (2)240; (3)上述估计合理。理由:样本的选取具有代表性。
2、【解答】:(1)在360位同学中:
购买甲品牌的人数为:(人)
购买乙品牌的人数为:(人)
购买丙品牌的人数为:(人)
3、D 解析 求解这道折线统计图信息题的关键是弄懂纵轴所表示的意义。它表示的是“人均收入每年比上年的增长率”。
如:2003年的“5.6”是指2003年比2002年人均收入增长了,所以A选项错误;又如2005年的“11.9”是指2005年比2004年人均收入增长,。这里2004年的“13.3”,只能表明在2001年至2005年这5年中,每年比上年增长的最多的是2004年,即使2005年只有“1”,那么也表明2005年“农村居民人均收入最多”,所以C选项错误。
4、(1)。略
(2)因为150名学生中身高不低于161cm的人数为:27+15+6=48人,照这样计算,该地区3000名学生中,身高不低于161cm的人数有(人)
5、(1)300(人)
(2)5, 45, 35%, 图略
(3)C超市 可以从平均数或中位数等方面说明,说理合理就行
17
展开阅读全文