1、目录目录3.3 分析化学中的数据处理分析化学中的数据处理(重点重点)3.4 显著性检验显著性检验(考研考研)3.5 可疑值取舍可疑值取舍(考研考研)3.6 回归分析法回归分析法(了解了解)3.7 提高分析结果准确度的方法提高分析结果准确度的方法(重点重点)3.3 3.3 分析化学中的数据处理分析化学中的数据处理1.1.总体和样本总体和样本(重点重点)在统计学中,对于所考察在统计学中,对于所考察的对象的全体,称为的对象的全体,称为总体总体(或母体或母体)。自总体中随机抽取的一组测自总体中随机抽取的一组测量值,称为量值,称为样本样本(或子样或子样)。样本中所含测量值的数目样本中所含测量值的数目称为
2、称为样本大小样本大小(或容量或容量)。(1)(1)样本平均值样本平均值(2)(2)总体平均值总体平均值 若没有若没有系统误差系统误差,则总体平,则总体平均值均值 就是真值就是真值x xT T。2.2.标准偏差标准偏差(standard deviation)(standard deviation)(重点重点)(1)(1)总体标准偏差总体标准偏差 :(2)(2)样本标准偏差样本标准偏差:式中式中(n(n 1)1)为为自由度自由度(degree of degree of freedomfreedom),以,以 f f 表示,当测量次数非常表示,当测量次数非常多时多时 3.3.相对标准偏差相对标准偏差
3、(又称又称变异系数变异系数)(重重点点)4.4.标准偏差与平均偏差标准偏差与平均偏差(了解了解)当测定次数非常多当测定次数非常多(例如大于例如大于20)20)时,时,标准偏差与平均偏差有下列关系:标准偏差与平均偏差有下列关系:=0.79790.80=0.79790.80 3.3.1 3.3.1 随机误差的正态分布随机误差的正态分布(考考研研)1.1.频数分布频数分布 在相同条件下对某样品中镍的质量分数在相同条件下对某样品中镍的质量分数(%)(%)进进行重复测定,得到行重复测定,得到9090个测定值如下:个测定值如下:1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.60
4、 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.601.62 1.57 1.60 1.59 1.64 1.59 1.64 1.741.74 1.65 1.64 1.61 1.65 1.65 1.64 1.61 1.65 1.69 1.64 1.631.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.701.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.70 1.6
5、3 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.601.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.521.62 1.55 1.52 1.491.49 1.56 1.57 1.61 1.61 1.61 1.50 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.591.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.66 1.63 1.
6、54 1.66 1.64 1.64 1.64 1.62 1.62 1.651.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.611.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.691.67 1.68 1.69 分分组组(%)(%)频频数数 相对频数相对频数 1.485-1.515 1.485-1.515 2
7、2 0.0220.022 1.515-1.545 1.515-1.545 6 6 0.0670.067 1.545-1.575 1.545-1.575 6 6 0.0670.067 1.575-1.605 1.575-1.605 17 17 0.1890.189 1.605-1.635 1.605-1.635 2222 0.2440.244 1.635-1.665 1.635-1.665 20 20 0.2220.222 1.665-1.695 1.665-1.695 10 10 0.1110.111 1.695-1.725 1.695-1.725 6 6 0.0670.067 1.725-1
8、.755 1.725-1.755 1 1 0.0110.011 90 1.0090 1.00 频率分布的直方图频率分布的直方图2.2.正态分布正态分布 正态分布曲线中,当以正态分布曲线中,当以 x x 作为作为横坐标时,表示测量值的概率分布横坐标时,表示测量值的概率分布 ;当以当以 (x-x-)作为横坐标时,表示随作为横坐标时,表示随机误差的概率分布。机误差的概率分布。x=x=时,时,y y 最大最大大部分测量值集中大部分测量值集中在算术平均值附近;在算术平均值附近;曲曲线线以以x=x=的的直直线线为为对对称称正正负负误误差差出出现的概率相等;现的概率相等;当当 xx或或 时时,曲曲线线渐渐进
9、进x x 轴轴,小小误误差差出出现现的的几几率率大大,大大误误差差出出现现的的几几率率小小,极极大大误误差差出出现现的的几几率率极小,趋近于零。极小,趋近于零。1.1.平均值的标准偏差平均值的标准偏差 (n n)对于有限次测量对于有限次测量 3.3.2 3.3.2 总体平均值的估计总体平均值的估计(考研)2 2.平均值的置信区间平均值的置信区间 置信度置信度(P)(P):人们对所作:人们对所作判断的有把握程度,其实质是某件判断的有把握程度,其实质是某件事出现的概率事出现的概率(P=1-(P=1-)显著性水准显著性水准():=1=1 P P。l平均值的置信区间:平均值的置信区间:l 在某一置信度
10、下,以平均在某一置信度下,以平均值为中心的可能包括有真值的范围,值为中心的可能包括有真值的范围,叫做平均值的置信区间。叫做平均值的置信区间。l例如例如=47.50=47.500.10(0.10(置信度为置信度为95%)95%)l在在47.5047.500.100.10的区间内包括总体平均的区间内包括总体平均值值的概率为的概率为95%95%。因为。因为是客观存是客观存在的确定的数,它没有随机性,不能在的确定的数,它没有随机性,不能说它落在某一区间的概率是多少。说它落在某一区间的概率是多少。例题:在置信度为例题:在置信度为95%95%时,测得时,测得AlAl2 2O O3 3的平均值的平均值的置信
11、区间为的置信区间为35.21%35.21%0.10%0.10%,其意义是,其意义是()A.A.在所测定的数据中有在所测定的数据中有95%95%的数据在此区间内。的数据在此区间内。B.B.若再次测定系列数据,将有若再次测定系列数据,将有95%95%的数据落入的数据落入此区间。此区间。C.C.总体平均值落入此区间的概率为总体平均值落入此区间的概率为95%95%。D.D.在此区间内包括总体平均值的概率为在此区间内包括总体平均值的概率为95%95%。1.1.置信度不变置信度不变时时:n n 增加,增加,t t 变变小,小,置信区间变小。置信区间变小。2.2.n n不变时:不变时:置信度增加,置信度增加
12、,t t 变大,变大,置信区间变大。置信区间变大。THANK YOUSUCCESS2024/1/31 周三17可编辑l练习题:练习题:l 分析一批石灰石中钙的百分分析一批石灰石中钙的百分含量,测得结果如下:含量,测得结果如下:20.44%20.44%,20.64%20.64%,20.56%20.56%,20.70%20.70%,20.78%20.78%,20.52%20.52%,计算置信度为,计算置信度为99%99%时,平均值时,平均值的置信区间。(的置信区间。(t t0.01,50.01,5=4.03=4.03)l解:平均值解:平均值=20.61%=20.61%l标准偏差标准偏差=0.12%
13、=0.12%l置信度为置信度为99%99%时,时,t t0.01,50.01,5=4.03=4.03l=20.61%=20.61%4.034.03(0.12%/2.45)(0.12%/2.45)l =20.61%=20.61%0.20%0.20%3.4 3.4 显著性检验显著性检验(考研考研)l3.4.1 3.4.1 t t 检验法检验法(平均值与标准值的比平均值与标准值的比较较)l通常以置信度通常以置信度P=95P=95作为检验标准,作为检验标准,如果计算出的如果计算出的t t值大于教材值大于教材6161页表页表3-33-3中中的的t ta a,f f 值,则认为存在显著性差异,否值,则认为
14、存在显著性差异,否则,则不存在显著性差异。则,则不存在显著性差异。l例:采用一种新方法分析标准钢样例:采用一种新方法分析标准钢样中铬含量,已知中铬含量,已知=1.17%=1.17%,5 5次测定次测定结果结果(%)(%)为为1.121.12,1.151.15,1.131.13,1.16 1.16 和和1.141.14,问这种新方法是否可靠,问这种新方法是否可靠(置置信度为信度为95%)95%)?l而而P=95%P=95%,f f=4=4时,查表知时,查表知 t t0.05,40.05,4=2.782.78。lt t计计 t t表表,说明平均值与标准值之间的,说明平均值与标准值之间的差异是显著性
15、差异,新方法可能存在系差异是显著性差异,新方法可能存在系统误差,不可靠。统误差,不可靠。n=5n=5 解:解:l3.4.2 3.4.2 F F检验法检验法lF F检验法是通过比较两组数据的方差检验法是通过比较两组数据的方差s s2 2,以确定它们的精密度是否有显著性差,以确定它们的精密度是否有显著性差异的方法。异的方法。l将计算所得将计算所得F F值与教材值与教材6464页表页表3-43-4所列所列F F值进行比较,若计算值大于表值,则认值进行比较,若计算值大于表值,则认为它们之间存在显著性差异为它们之间存在显著性差异(置信度置信度9595),否则不存在显著性差异。,否则不存在显著性差异。l例
16、题例题 (P65(P65例例12)12):l为检验新方法分析样品的可靠性,与经为检验新方法分析样品的可靠性,与经典方法作比较,结果如下:原方法:典方法作比较,结果如下:原方法:1.35%1.35%,1.31%1.31%,1.33%1.33%,1.34%1.34%;新方法:;新方法:1.26%1.26%,1.25%1.25%,1.22%1.22%,问两种方法的,问两种方法的精密度是否有显著性差异精密度是否有显著性差异(置信度为置信度为95%)95%)?l原方法:原方法:,s=0.017%s=0.017%,n n1 1=4=4l新方法:新方法:,s=0.021%s=0.021%,n n2 2=3=
17、3lf fs s大大 =n=n2 2-1=2-1=2,f fs s小小 =n=n1 1-1=3-1=3,l查表知查表知F F表表 =9.55=9.55,F F计计F F表表,l故两种方法的精密度无显著性差异。故两种方法的精密度无显著性差异。3.5 3.5 异常值的取舍异常值的取舍(考研考研)l3.5.13.5.1 用用 判判断断异异常常值值的的取取舍舍时时,首首先先除除去去异异常常值值,然然后后求求出出其其余余数数据据的的平平均均值值和和平平均均偏偏差差,最最后后将将异异常常值值与与平平均值进行比较。如果均值进行比较。如果 则将可疑值舍去,否则保留。则将可疑值舍去,否则保留。l3.5.2 3.
18、5.2 格鲁布斯格鲁布斯(Grubbs)(Grubbs)法法l将一组数据,从小到大排列为:将一组数据,从小到大排列为:lx x1 1,x x2 2,,x xn-1n-1,x xn nl其中其中 x x1 1 或或 x xn n 可能是异常值,可能是异常值,l设设 x x1 1 是可疑的,则是可疑的,则l若若 x xn n 是可疑的,则是可疑的,则l将计算所得将计算所得T T值与值与6767页表页表3-53-5中相应中相应数值比较,若数值比较,若 T TT Ta,a,n n,则异常值应,则异常值应舍去,否则应保留。舍去,否则应保留。l3.5.3 3.5.3 Q Q 检验法检验法l将一组数据,从小
19、到大排列为:将一组数据,从小到大排列为:lx x1 1,x x2 2,,x xn-1n-1,x xn nl设设 x xn n 为异常值,则统计量为异常值,则统计量Q Q为为l设设 x x1 1 为异常值,则统计量为异常值,则统计量Q Q为为l将计算所得将计算所得Q Q值与值与6868页表页表3 36 6中相应数值中相应数值比较,若比较,若Q QQ Q表表,则异常值应舍去,否,则异常值应舍去,否则应保留。则应保留。l例题:分别用例题:分别用 、格鲁布斯、格鲁布斯法法(P=95%)(P=95%)和和Q Q检验法检验法(P=90%)(P=90%)判断下面判断下面这组数据中的这组数据中的60.2760
20、.27是否应予舍去?是否应予舍去?60.2260.22,60.2360.23,60.1560.15,60.2460.24,60.2160.21,60.2060.20,60.2760.27,60.2060.20,60.2560.25,60.2360.23。解:解:1)1)除去可疑值除去可疑值60.2760.27后,剩余后,剩余9 9个数据:个数据:故故60.2760.27应予保留。应予保留。l2)2)格鲁布斯法格鲁布斯法l将这组数据从小到大排列为:将这组数据从小到大排列为:l60.1560.15,60.2060.20,60.2060.20,60.2160.21,60.2260.22,60.236
21、0.23,60.2360.23,60.2460.24,60.2560.25,60.2760.27lP=95%P=95%时,时,T T表表=2.18 T=2.18 T,故,故60.2760.27应予保留。应予保留。l3)3)Q Q检验法检验法l将这组数据从小到大排列为:将这组数据从小到大排列为:l60.1560.15,60.2060.20,60.2060.20,60.2160.21,60.2260.22,60.2360.23,60.2360.23,60.2460.24,60.2560.25,60.2760.27lP=90%P=90%时,时,Q Q表表=0.41 =0.41 Q Q,故故60.2760.27应予保留。应予保留。3.6 3.6 回归分析法回归分析法(了解了解)THANK YOUSUCCESS2024/1/31 周三34可编辑
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100