1、众数、中位数、平均数与频率分布直方图关系用样本数字特征预计总体数字特征用样本数字特征预计总体数字特征(制作老师制作老师:欧阳文丰欧阳文丰)第1页一一 众数、中位数、平均数概念众数、中位数、平均数概念 中位数中位数:将一组数据按大小依次排列,:将一组数据按大小依次排列,把处于最中间位置一个数据(或最中间两把处于最中间位置一个数据(或最中间两个数据平均数)叫做这组数据中位数个数据平均数)叫做这组数据中位数 众数众数:在一组数据中,出现次数最多:在一组数据中,出现次数最多数据叫做这组数据众数数据叫做这组数据众数 众数、中位数、平均数都是描述一组众数、中位数、平均数都是描述一组数据集中趋势特征数,只是
2、描述角度不一数据集中趋势特征数,只是描述角度不一样,其中以平均数应用最为广泛样,其中以平均数应用最为广泛.第2页平均数:一组数据算术平均数,即 x=1、平均数平均数:由数据及频率计算平均数由数据及频率计算平均数,即即 x=x1f1+x2f2+xkfk (其中其中fk是是xk频率。频率。)2、加权、加权平均数平均数:由数据及其权数和样本容量计算平均由数据及其权数和样本容量计算平均数数,即即x=(x1n1+x2n2+xknk)/n(其中其中nk是是xk权数权数,n为样本容量为样本容量,且且n1+n2+nk=n.)3、已知已知xn平均数为平均数为x,则则kxn+b平均数为平均数为kx+b。平均数平均
3、数:一组数据算术平均数一组数据算术平均数,即即 第3页 二二、众数、中位数、平均数众数、中位数、平均数与频率分布直方图关系与频率分布直方图关系(在只有频率分布直方图情况下,也能够预计总体特征在只有频率分布直方图情况下,也能够预计总体特征,而且直方图比较直观便而且直方图比较直观便于形象地进行分析。于形象地进行分析。)1、众数在样本数据频率分布直方图中,就众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。是最高矩形中点横坐标。当最高矩形数据组为当最高矩形数据组为a,b)时时,那么那么(a+b)/2就是众数。就是众数。第4页频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5
4、2 2.5 3 3.5 4 4.5 月平均用水量(t)例题分析:月均用水量众数是月均用水量众数是2.25t.如图所表示:如图所表示:(2+2.5)/2=2.25第5页2、从频率分布直方图中预计、从频率分布直方图中预计中位数中位数(中位数是样本数据所占频率等分线。)中位数是样本数据所占频率等分线。)中位数是样本数据所占频率等分线。)中位数是样本数据所占频率等分线。)当最高矩形数据组为当最高矩形数据组为a,b)时时,设中位数设中位数为为(a+X),依据中位数定义得知,依据中位数定义得知,中位数左中位数左边立方图小矩形面积为边立方图小矩形面积为0.5,列方程得:列方程得:当最高矩形数据组之当最高矩形
5、数据组之前全部小矩形面积之和为fm;(频率直方图面积计算,即组距乘以频率频率直方图面积计算,即组距乘以频率/组距。)组距。)x*最高矩形最高矩形(频率频率/组距组距)+fm=0.5求解X,那么a+X即为中位数。即为中位数。第6页思索题:怎样从频率分布直方图中预计思索题:怎样从频率分布直方图中预计中位数中位数?中位数左边立方图小矩形面积为中位数左边立方图小矩形面积为0.502小矩形面积之和为:0.5(0.08+0.16+0.30+0.44)=0.490.200.400.100 0.5 1 1.522.53 3.5 4 4.50.500.30频率频率/组距组距月均用水量月均用水量/t0.080.1
6、60.440.50.490.010.01/0.5=0.02如图在直线t2.02之前全部小矩形面积为0.5所以该样本中位数为2.02第7页练习练习.(广东(广东11变式题变式题1)为了调查某厂工人生产)为了调查某厂工人生产某种产品能力,随机抽查某种产品能力,随机抽查了了20位工人某天生产位工人某天生产该产品数量该产品数量.产品数量分组区间为产品数量分组区间为,分布直方图如图分布直方图如图3,则这,则这20名工人中一天生产名工人中一天生产中位数中位数.该产品该产品数量在数量在由此得到频率由此得到频率第8页 3、平均数是频率分布直方图平均数是频率分布直方图“重心重心”.是直方图平衡点是直方图平衡点.
7、n 个样本数据平均数由公式个样本数据平均数由公式:X=假设每组数据分别为假设每组数据分别为a1,b1)、)、a2,b2)、)、ak,bk)时)时,且每组数据对应且每组数据对应频率分别为频率分别为f1、f2、fk;那么样本平均那么样本平均数数(或总体数学期望或总体数学期望)由以下公式计算即可。由以下公式计算即可。第9页由频率分布直方图预计样本平由频率分布直方图预计样本平均数均数(或总体数学期望或总体数学期望)公式:公式:X =(a1+b1)/2*f1+(a2+b2)/2*f2+(ak+bk)/2*fk(其中每组数据频率还能够由频率直方图面积计算而得,即组距乘以频率其中每组数据频率还能够由频率直方
8、图面积计算而得,即组距乘以频率/组距。)组距。)第10页练习练习.(广东(广东11变式题变式题2)为了调查某厂工人生产)为了调查某厂工人生产某种产品能力,随机抽查某种产品能力,随机抽查了了20位工人某天生产位工人某天生产该产品数量该产品数量.产品数量分组区间为产品数量分组区间为,分布直方图如图分布直方图如图3,则这,则这20名工人中一天生产名工人中一天生产平均数平均数.该产品该产品数量在数量在由此得到频率由此得到频率第11页总体分布预计练习:对某电子元件进行寿命追踪调查,情况以下:练习:对某电子元件进行寿命追踪调查,情况以下:寿命寿命个数个数10020020030030040040050050
9、06002030804030(1)列出频率分布表;)列出频率分布表;(2)画出频率分布直方图;)画出频率分布直方图;(3)预计电子元件寿命在)预计电子元件寿命在100h400h以内概率;以内概率;(4)预计电子元件寿命在)预计电子元件寿命在400h以上概率;以上概率;(5)预计总体数学期望)预计总体数学期望.第12页总体分布预计100200200300300400400500500600寿命寿命累计累计频率频率频数频数累积频率累积频率20308040302000.100.150.400.200.1510.100.250.650.851频率频率/组距组距第13页总体分布预计第14页思索:思索:从
10、样本数据可知,所求得该样本众数、从样本数据可知,所求得该样本众数、中位数和平均数,这与我们从样本频率分布中位数和平均数,这与我们从样本频率分布直方图得出结论有偏差,你能解释一下原因直方图得出结论有偏差,你能解释一下原因吗?吗?频率分布直方图损失了一些样本数据,得频率分布直方图损失了一些样本数据,得到是一个预计值,且所得估值与数据分组相到是一个预计值,且所得估值与数据分组相关关.注注:在只有样本频率分布直方图情况下,我们在只有样本频率分布直方图情况下,我们能够按上述方法预计众数、中位数和平均数,能够按上述方法预计众数、中位数和平均数,并由此预计总体特征并由此预计总体特征.第15页 三、用频率分布
11、直方图预计总体数字特征利弊:利弊:总体各种数值特征都能够由两种路径来预计,总体各种数值特征都能够由两种路径来预计,直接利用样本数据或由频率分布直方图来预计。直接利用样本数据或由频率分布直方图来预计。两种方法各有利弊;比如:两种方法各有利弊;比如:1、经过频率分布直方图预计精度低;、经过频率分布直方图预计精度低;2 2、经过频率分布直方图预计结果与数据分组相、经过频率分布直方图预计结果与数据分组相关;关;3 3、在不能得到样本数据,只能得到频率分布直、在不能得到样本数据,只能得到频率分布直方图情况下,也能够预计总体特征方图情况下,也能够预计总体特征,而且直方图而且直方图比较直观便于形象地进行分析
12、。比较直观便于形象地进行分析。第16页四、三种数字特征优缺点四、三种数字特征优缺点:(1 1)众数表达了样本数据最大集中点)众数表达了样本数据最大集中点,但它显然对其但它显然对其但它显然对其但它显然对其它数据信息忽略使得无法客观地反应总体特征。它数据信息忽略使得无法客观地反应总体特征。它数据信息忽略使得无法客观地反应总体特征。它数据信息忽略使得无法客观地反应总体特征。(2 2)中位数是样本数据所占频率等分线,它不受少)中位数是样本数据所占频率等分线,它不受少数几个极端值影响,这在一些情况下是优点,数几个极端值影响,这在一些情况下是优点,但它但它但它但它对极端值不敏感有时也会成为缺点对极端值不敏
13、感有时也会成为缺点对极端值不敏感有时也会成为缺点对极端值不敏感有时也会成为缺点.(3 3)因为平均数与每一个样本数据相关,所以任何)因为平均数与每一个样本数据相关,所以任何一个样本数据改变都会引发平均数改变,这是众数、一个样本数据改变都会引发平均数改变,这是众数、中位数都不含有性质。中位数都不含有性质。但平均数受数据中极端值影但平均数受数据中极端值影但平均数受数据中极端值影但平均数受数据中极端值影响较大,使平均数在预计总体时可靠性降低。响较大,使平均数在预计总体时可靠性降低。响较大,使平均数在预计总体时可靠性降低。响较大,使平均数在预计总体时可靠性降低。第17页1 1、在一次歌手大奖赛上,七位
14、评委为歌手打出分数、在一次歌手大奖赛上,七位评委为歌手打出分数以下:以下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去掉一个最高分,去掉一个最高分和一个最低分后,所剩数据平均值和方差分别为和一个最低分后,所剩数据平均值和方差分别为_;2 2、已知数据、已知数据 平均数是平均数是3 3,方差为,方差为2 2,求数,求数据据 平均数、方差、标准差?平均数、方差、标准差?9.5,0.016解:平均数是解:平均数是6,方差是,方差是8,标准差是,标准差是.去掉最高分和最低分合理吗?假如求假如求平均数、方差、标平均数、方差、标准差?准差?已知已知ai平均数平均数X、方差、方差Y、标准差、标准差Z,则则b+kai平均数是平均数是b+kx,方差是方差是k平方与平方与Y乘积乘积,标准差是标准差是k与与Z乘积。乘积。(当然当然Y=Z平方平方!)第18页总结总结众数、中位数、平均数与频率分布直方图关系:众数、中位数、平均数与频率分布直方图关系:1、众数在样本数据频率分布直方图中,就是众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。最高矩形中点横坐标。2、中位数左边和右边直方图中位数左边和右边直方图面积应该相等面积应该相等,由取可预计中位数值。由取可预计中位数值。3、平均数是直方图、平均数是直方图“重心重心”(平衡点)(平衡点).第19页