1、数据分析数据分析-复习复习课课 第1页知识网络:知识网络:知识点知识点回顾回顾数据代表数据代表数据波动数据波动平均数平均数中位数中位数众众 数数极极 差差方方 差差用样本预计总体用样本预计总体用样本平均数估用样本平均数估计总体平均数计总体平均数用样本方差预计用样本方差预计总体方差总体方差第2页本单元知识点本单元知识点:1.用用样本预计总体样本预计总体是统计基本思想是统计基本思想.在生活和生产中在生活和生产中,为了解总体情况为了解总体情况,我们经常采取从总体中抽取样本我们经常采取从总体中抽取样本,经经过对样本调查过对样本调查,取得关于样本数据和结论取得关于样本数据和结论,再利用样本再利用样本结论
2、对总体进行预计结论对总体进行预计.2.平均数、中位数、众数意义平均数、中位数、众数意义.3.了解算术平均数与加权平均数有什么联络和区分了解算术平均数与加权平均数有什么联络和区分.说明加权平均数中说明加权平均数中“权权”意义。意义。4.极差和方差是怎样刻画数据波动情况极差和方差是怎样刻画数据波动情况.第3页问题问题1:求加权平均数公式是什么?:求加权平均数公式是什么?在求在求n个数算术平均数时个数算术平均数时,假如假如x1出现出现f1次次,x2出现出现f2次次,,xk出现出现fk次次(这里这里f1+f2+fk=n)那么这那么这n个数个数算术平均数为算术平均数为:若若n个数个数x1,x2,xn权分
3、别是权分别是w1,w2,wn则:则:叫做这叫做这n个数个数加加权平均数权平均数。第4页将一组数据按照由小到大将一组数据按照由小到大(或由大到小或由大到小)次序排列次序排列假如数据个数是奇数,则处于中间位置数就是这组数假如数据个数是奇数,则处于中间位置数就是这组数据据中位数中位数。假如数据个数是偶数,则中间两个数据平假如数据个数是偶数,则中间两个数据平均数就是这组数据均数就是这组数据中位数中位数。中位数是一个中位数是一个位置代表值位置代表值。假如已知一组数据。假如已知一组数据中位数,那么能够知道,小于等于或大于等于这个中位数,那么能够知道,小于等于或大于等于这个中位数数据中位数数据各占二分之一各
4、占二分之一。一组数据中出现一组数据中出现次数最多次数最多数据就是这组数据数据就是这组数据众数众数.问题问题2:什么叫中位数?什么叫众数?:什么叫中位数?什么叫众数?第5页平均数、中位数、众数比较平均数、中位数、众数比较:平均数、中位数和众数都能够作为一组平均数、中位数和众数都能够作为一组数据代表,是描述一组数据数据代表,是描述一组数据集中趋势集中趋势量,量,平均数是应用较多一个量。实际问题中平均数是应用较多一个量。实际问题中求得平均数、众数、中位数应带上对应求得平均数、众数、中位数应带上对应单位单位。1.联络:联络:第6页平均数、中位数、众数比较平均数、中位数、众数比较:平均数平均数计算要用到
5、全部数据,它能充分利用全部数计算要用到全部数据,它能充分利用全部数据信息,任何一个数据变动都会引发平均数变动,而据信息,任何一个数据变动都会引发平均数变动,而且它受且它受极端值极端值影响较大;影响较大;2.区分:区分:中位数中位数仅与数据仅与数据排列位置排列位置相关,一些数据移动对中相关,一些数据移动对中位数没有影响,中位数可能出现在所给数据中也可能位数没有影响,中位数可能出现在所给数据中也可能不在所给数据中,当一组数据中不在所给数据中,当一组数据中个别数据变动较大个别数据变动较大时时,可用中位数描述其趋势;可用中位数描述其趋势;众数众数是当一组数据中某一数据是当一组数据中某一数据重复出现较多
6、重复出现较多时,时,人们往往关心一个量,众数不受极端值影响,这是人们往往关心一个量,众数不受极端值影响,这是它一个优势它一个优势.第7页极差:极差:一组数据中最大数据与最小数据差。一组数据中最大数据与最小数据差。极差是最简单一个度量数据波动情况量极差是最简单一个度量数据波动情况量,但只能反应但只能反应数据波动范围数据波动范围,不能衡量每个数据改变情况不能衡量每个数据改变情况,而且受而且受极端值影响较大极端值影响较大.各数据与平均数差平方平均数叫做这批数据各数据与平均数差平方平均数叫做这批数据方方差差。公式为:。公式为:方差越小,波动越小。方差越大,波动越大。方差越小,波动越小。方差越大,波动越
7、大。问题问题3:什么叫极差?什么叫方差?:什么叫极差?什么叫方差?第8页该班学生身高众数和中位数分别是该班学生身高众数和中位数分别是()1.某校五个绿化小组一天植树棵数以下:某校五个绿化小组一天植树棵数以下:10,10,12,x,8。已知这组数据众数与平均数相。已知这组数据众数与平均数相等,那么这组数据等,那么这组数据()A.x=8 B.x=9 C.x=10 D.x=12C 细心选一选细心选一选2.某班某班50名学生身高名学生身高(单位单位:m)测量结果以下:测量结果以下:C身高身高 1.51 1.52 1.53 1.54 1.55 1.56 1.57 1.58 1.59 1.60 1.64人
8、数人数113434468106A.1.60,1.56 B.1.59,1.58 C.1.60,1.58 D.1.60,1.60第9页3.10名学生体重分别是名学生体重分别是41,48,50,53,49,50,53,51,67(单位单位:kg),这组数据极差是这组数据极差是()A.27 B.26 C.25 D.24B细心选一选细心选一选4.假如一组数据假如一组数据a1,a2,an方差是方差是2,那么一,那么一组新数据组新数据2a1,2a2,2an方差是方差是()A.2 B.4 C.8 D.16C第10页5.甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟
9、输入汉字个数统计结果以下表:输入汉字个数统计结果以下表:某同学分析上表后得出以下结论:某同学分析上表后得出以下结论:甲、乙两班学生成绩平均水平相同;甲、乙两班学生成绩平均水平相同;乙班优异人数多于甲班优异人数乙班优异人数多于甲班优异人数(每分钟输入汉字每分钟输入汉字150个为优异个为优异);甲班成绩波动比乙班大,上述结论正确是甲班成绩波动比乙班大,上述结论正确是()AA.B.C.D.班级班级参加人数参加人数中位数中位数方差方差平均数平均数甲甲55149191135乙乙55151110135细心选一选细心选一选第11页1.为了调查某一路汽车流量,统计了为了调查某一路汽车流量,统计了30天中天天同
10、一天中天天同一时段经过该路口汽车辆数,其中时段经过该路口汽车辆数,其中4天是天是284辆,辆,4天是天是290辆,辆,12天是天是312辆,辆,10天是天是314辆,那么这辆,那么这30天该天该路口同一时段经过汽车平均数为路口同一时段经过汽车平均数为 。填一填填一填306辆辆2.小芳测得连续小芳测得连续5天日最低气温并整理后得出下表:天日最低气温并整理后得出下表:日期日期一一二二三三四四五五方差方差平均气温平均气温最低气温最低气温1325423因为不小心被污染了两个数据,这两个数据分别因为不小心被污染了两个数据,这两个数据分别是是 、。4 2第12页3.某地两校联谊文艺晚会上,甲、乙两个文艺节
11、目均由某地两校联谊文艺晚会上,甲、乙两个文艺节目均由10个演员演出,他们年纪个演员演出,他们年纪(岁岁)分别以下:分别以下:甲节目:甲节目:13,13,14,15,15,15,15,16,17,17乙节目:乙节目:5,5,6,6,6,6,7,7,50,52(1)甲节目中演员年纪中位数是甲节目中演员年纪中位数是 ;乙节目中演员年纪众数是乙节目中演员年纪众数是 .(2)两个节目中,演员年纪波动较小两个节目中,演员年纪波动较小 是是 .填一填填一填156甲节目中演员年纪甲节目中演员年纪第13页1.某企业招聘职员,对甲、乙两位候选人进行了面试某企业招聘职员,对甲、乙两位候选人进行了面试和笔试,面试包含
12、形体和口才,笔试中包含专业水平和笔试,面试包含形体和口才,笔试中包含专业水平和创新能力考查,他们成绩和创新能力考查,他们成绩(百分制百分制)以下表以下表:(1)若企业依据经营性质和岗位要求认为若企业依据经营性质和岗位要求认为:形体、口才、形体、口才、专业水平、创新能力按照专业水平、创新能力按照5:5:4:6比确定,请计算甲比确定,请计算甲、乙两人各自平均成绩,看看谁将被录用?、乙两人各自平均成绩,看看谁将被录用?候选候选人人面试面试笔试笔试形体形体口才口才专业水平专业水平创新能力创新能力甲甲86909692乙乙92889593算一算算一算第14页解解:(1)乙将被录用。乙将被录用。第15页1.
13、某企业招聘职员,对甲、乙两位候选人进行了面试某企业招聘职员,对甲、乙两位候选人进行了面试和笔试,面试包含形体和口才,笔试中包含专业水平和笔试,面试包含形体和口才,笔试中包含专业水平和创新能力考查,他们成绩和创新能力考查,他们成绩(百分制百分制)以下表以下表:候选候选人人面试面试笔试笔试形体形体口才口才专业水平专业水平创新能力创新能力甲甲86909692乙乙92889593算一算算一算(2)若企业依据经营性质和岗位要求认为若企业依据经营性质和岗位要求认为:面试成绩中面试成绩中形体占形体占5%,口才占,口才占30%,笔试成绩中专业水平点,笔试成绩中专业水平点35%,创新能力点,创新能力点30%,那
14、么你认为该企业会录用谁?,那么你认为该企业会录用谁?第16页(1)(2)结果不一样说结果不一样说明了什么?明了什么?在加权平均数中在加权平均数中,因为权不一样因为权不一样,造成结果不一样造成结果不一样.解解:(2)甲将被录用。甲将被录用。第17页 2.当今当今,青少年视力水平下降已引发社会关注青少年视力水平下降已引发社会关注,为了了解为了了解某校某校3000名学生视力情况名学生视力情况,从中抽取了一部分学生进行了从中抽取了一部分学生进行了一次抽样调查一次抽样调查,利用所得数据绘制直方图利用所得数据绘制直方图(长方形高表示长方形高表示该组人数该组人数)以下:以下:3.953.9550403020
15、10 x(视力视力)y(人数人数)4.254.25 4.554.55 4.854.85 5.155.15 5.455.45算一算算一算(1)此次抽样抽查共抽测了多少名学生此次抽样抽查共抽测了多少名学生?解解:(1)30+50+40+20+10=150(人人)(2)参加抽测学生视力众数参加抽测学生视力众数在什么范围内?在什么范围内?众数在众数在4.254.55内内.第18页 2.当今当今,青少年视力水平下降已引发社会关注青少年视力水平下降已引发社会关注,为了了解为了了解某校某校3000名学生视力情况名学生视力情况,从中抽取了一部分学生进行了从中抽取了一部分学生进行了一次抽样调查一次抽样调查,利用
16、所得数据绘制直方图利用所得数据绘制直方图(长方形高表示长方形高表示该组人数该组人数)以下:以下:3.953.955040302010 x(视力视力)y(人数人数)4.254.25 4.554.55 4.854.85 5.155.15 5.455.45算一算算一算(3)若视力为若视力为4.9,5.0,5.1及以上及以上为正常为正常,试预计该校视力正常人数试预计该校视力正常人数约为多少?约为多少?第19页 3.某农民几年前承包了甲、乙两片荒山某农民几年前承包了甲、乙两片荒山,各栽种了各栽种了100棵棵蜜桔蜜桔,成活成活98%.现已挂果现已挂果.为了分析经营情况为了分析经营情况,他从甲山他从甲山随意
17、采摘了随意采摘了3棵树上蜜桔棵树上蜜桔,称得质量分别为称得质量分别为25,18,20千千克克;又从乙山采摘了又从乙山采摘了4棵树上蜜桔棵树上蜜桔,称得质量分别是称得质量分别是21,24,19,20千克千克,组成一个样本组成一个样本,问:问:(1)样本容量是多少?样本容量是多少?算一算算一算解解:(1)样本容量为样本容量为:3+4=7;(2)样本平均数是多少?并估算出甲、乙两山蜜桔总产样本平均数是多少?并估算出甲、乙两山蜜桔总产量?量?总产量为:总产量为:2120098%=4116(千克千克)第20页 3.某农民几年前承包了甲、乙两片荒山某农民几年前承包了甲、乙两片荒山,各栽种了各栽种了100棵
18、棵蜜桔蜜桔,成活成活98%.现已挂果现已挂果.为了分析经营情况为了分析经营情况,他从甲山他从甲山随意采摘了随意采摘了3棵树上蜜桔棵树上蜜桔,称得质量分别为称得质量分别为25,18,20千千克克;又从乙山采摘了又从乙山采摘了4棵树上蜜桔棵树上蜜桔,称得质量分别是称得质量分别是21,24,19,20千克千克,组成一个样本组成一个样本,问:问:(3)甲、乙两山哪个山上蜜桔长势较整齐?甲、乙两山哪个山上蜜桔长势较整齐?算一算算一算所以乙山上桔子长势比较整齐。所以乙山上桔子长势比较整齐。解解:(3)第21页4.某商场统计了每个营业员在某月销售额某商场统计了每个营业员在某月销售额,统计图以下统计图以下:销
19、售额销售额x(万元万元)人数人数解答以下问题:解答以下问题:(1)设营业员月销售额为设营业员月销售额为x(万元万元),商场要求:当商场要求:当x15时为不称职,时为不称职,当当15x20时,为基本称职,时,为基本称职,当当20 x25为称职为称职,当当x25时为优异时为优异,试求出不称职、基本称职、称职、优试求出不称职、基本称职、称职、优异四个层次营业员人数所占百分比,异四个层次营业员人数所占百分比,并用扇形图统计出来。并用扇形图统计出来。解:如图所表解:如图所表示示不称职不称职基本称职基本称职称职称职优异优异第22页(2)依据依据(1)中要求,全部称职和优异营业员月销售额中位数、中要求,全部
20、称职和优异营业员月销售额中位数、众数和平均数分别是多少?众数和平均数分别是多少?解:中位数是解:中位数是2222万元,众数是万元,众数是2020万元,平均数是万元,平均数是22.322.3万元万元(3)为了调动营业员工作主动性,决定制订月销售额奖励标准,为了调动营业员工作主动性,决定制订月销售额奖励标准,凡到达或超出这个标准营业员将受到奖励。假如要使得称职和凡到达或超出这个标准营业员将受到奖励。假如要使得称职和优异全部营业员半数左右能获奖,你认为这个奖励标准应定为优异全部营业员半数左右能获奖,你认为这个奖励标准应定为多少元适当?并简述其理由。多少元适当?并简述其理由。解:奖励标准应定为解:奖励
21、标准应定为2222万元。万元。第23页解:一组平均分解:一组平均分x=84.08分,中位数为分,中位数为84.5分,分,方差方差S2184.58;二组平均分二组平均分x=80.58分,中位数为分,中位数为77分,分,方差方差S2238.08;所以所以,从平均分可看出一组整体成绩很好从平均分可看出一组整体成绩很好;从中位数能从中位数能够看出一组整体成绩靠前够看出一组整体成绩靠前;从方差能够看出一组同学成从方差能够看出一组同学成绩差距不大,因而一组学生成绩各方面都很好。绩差距不大,因而一组学生成绩各方面都很好。5.在一次数学测验中在一次数学测验中,八年级八年级(1)班两个组班两个组12名学生成绩名学生成绩以下以下(单位:分单位:分)一组一组:109 97 83 94 65 72 87 96 59 85 78 84二组二组:98 81 58 74 95 100 61 73 80 94 57 96试对这两个小组数学考试成绩作出比较和分析。试对这两个小组数学考试成绩作出比较和分析。第24页第25页