1、分析化学(第六版)总结第二章 误差和分析数据处理第一节 误差定量分析中的误差就其来源和性质的不同,可分为系统误差、偶然误差和过失误差。一、系统误差定义:由于某种确定的原因引起的误差,也称可测误差特点:重现性,单向性,可测性(大小成比例或基本恒定)分类:1. 方法误差: 由于不适当的实验设计或所选方法不恰当所引起。 2. 仪器误差: 由于仪器未经校准或有缺陷所引起。3. 试剂误差: 试剂变质失效或杂质超标等不合格 所引起4. 操作误差: 分析者的习惯性操作与正确操作有一定差异所引起。 操作误差与操作过失引起的误差是不同的。二、偶然误差定义:由一些不确定的偶然原因所引起的误差,也叫随机误差. 偶然
2、误差的出现服从统计规律,呈正态分布。特点:随机性(单次)大小相等的正负误差出现的机会相等。小误差出现的机会多,大误差出现的机会少。三、过失误差1、过失误差:由于操作人员粗心大意、过度疲劳、精神不集中等引起的。其表现是出现离群值或异常值。2、过失误差的判断离群值的舍弃 a) 在重复多次测试时,常会发现某一数据与平均值的偏差大于其他所有数据,这在统计学上称为离群值或异常值。b) 离群值的取舍问题,实质上就是在不知情的情况下,区别两种性质不同的偶然误差和过失误差。离群值的检验方法:(1)Q 检验法:该方法计算简单,但有时欠准确。设有n个数据,其递增的顺序为x1,x2,xn-1,xn,其中x1或xn可
3、能为离群值。当测量数据不多(n=310)时,其Q的定义为具体检验步骤是:1) 将各数据按递增顺序排列;2)计算最大值与最小值之差;3)计算离群值与相邻值之差;4) 计算Q值;5)根据测定次数和要求的置信度,查表得到Q表值;6)若Q Q表,则舍去可疑值,否则应保留。该方法计算简单,但有时欠准确。(2)G检验法:该方法计算较复杂,但比较准确。具体检验步骤是:1)计算包括离群值在内的测定平均值;2)计算离群值与平均值 之差的绝对值3)计算包括离群值在内的标准偏差S4)计算G值。5)若G G,n ,则舍去可疑值,否则应保留第二节 测量值的准确度和精密度一、准确度与误差 1.准确度:指测量结果与真值的接
4、近程度,反映了测量的正确性,越接近准确度越高。系统误差影响分析结果的准确度 。 2.误差:准确度的高低可用误差来表示。误差有绝对误差和相对误差之分。(1)绝对误差:测量值x与真实值之差 (2)相对误差:绝对误差占真实值的百分比3.真值与标准参考物质任何测量都存在误差,绝对真值是不可能得到的,我们常用的真值是1) 理论真值:如三角形的内角和为180等。2) 约定真值:由国际权威机构国际计量大会定义的单位、数值,如 时间、长度、原子 量、物质的量等,是全球通用的 3) 相对真值:由某一行业或领域内的权威机构严格按标准方法获得的测量值,如卫生部药品检定所派发的标准参考物质,应用范围有一定的局限性。4
5、) 标准参考物质:具有相对真值的物质,也称为标准品,标样,对照品。应有很好的均匀性和稳定性,其含量测量的准确度至少要高于实际测量的3倍。二、精密度与偏差1精密度:平行测量值之间的相互接近程度,反映了测量的重现性,越接近精密度越高。偶然误差影响分析结果的精密度, 2偏差精密度的高低可用偏差来表示。偏差的表示方法有(1)绝对偏差 :单次测量值与平均值之差:(2)平均偏差:绝对偏差绝对值的平均值(3)相对平均偏差:平均偏差占平均值的百分比:(4)标准偏差(5)相对标准偏差(RSD, 又称变异系数CV )(必考相关大题)例:用邻二氮菲显色法测定水中铁的含量,结果为10.48, 10.37, 10.47
6、 10.43, 10.40 mg/L; 计算单次分析结果的平均偏差,相对平均偏差,标准偏差、相对标准偏差和置信区间(95和99)。(相关题目,此题做不成)三、准确度与精密度的关系1. 准确度高,一定要精密度好2. 精密度好,不一定准确度高。只有在消除了系统误差的前提下,精密度好,准确度才会高四、误差的传递:误差的传递分为系统误差的传递和偶然误差的传递。1.系统误差的传递 和、差的绝对误差等于各测量值绝对误差的和、差R = x + y -z R=x+y-z 积、商的相对误差等于各测量值相对误差的和、差 R = x y / z 2.偶然误差的传递 和、差结果的标准偏差的平方,等于各测量值的标准偏
7、差的平方和。R = x + y -z 积、商结果的相对标准偏差的平方,等于各测量值的相对标准偏差的平方和。R = x y / z 3.测量值的极值误差 在分析化学中,若需要估计一下整个过程可能出现的最大误差时,可用极值误差来表示。它假设在最不利的情况下各种误差都是最大的,而且是相互累积的,计算出结果的误差当然也是最大的,故称极值误差。五、提高分析结果准确度的方法1、系统误差的判断与评估(1)对照试验:选用组成与试样相近的标准试样,在相同条件下进行测定,测定结果与标准值对照,判断有无系统误差,又可用此差值对测定结果进行校正。(2)回收试验:其结果用于系统误差的评估,不能用于结果的校正。2、消除系
8、统误差的方法(一)选择恰当的分析方法,消除方法误差:不同方法,其灵敏度、准确度、精密度和选择性是不相同的,应根据待测组分的含量、性质、试样的组成及对准确度的要求来选择,还要考虑现有条件和分析成本。(二)校准仪器,消除仪器误差:对砝码、移液管、酸度计等进行校准,消除仪器引起的系统误差(三)采用不同方法, 减小测量的相对误差(四)空白实验,消除试剂误差:在不加试样的情况下,按试样分析步骤和条件进行分析实验,所得结果为空白值,从试样测定结果中扣除即可以消除试剂、蒸馏水和容器引入的杂质。(五)遵守操作规章,消除操作误差3、减小偶然误差的方法:增加平行测定次数,用平均值报告结果,一般测35次。第三节 有
9、效数字及其运算法则一、有效数字1.定义:为实际能测到的数字。有效数字的位数和分析过程所用的测量仪器的准确度有关。 有效数字准确数字+ 最后一位欠准的数(1) 如滴定管读数23.57ml,4位有效数字。称量质量为6.1498g,5位有效数字2. “0”的作用:作为有效数字使用或作为定位的标志。例:滴定管读数为20.30毫升, 有效数字位数是四位。表示为0.02030升,前两个0是 起定位作用的,不是有效数字,此数据仍是四位有效数字。3. 规定(1)改变单位并不改变有效数字的位数。20.30ml 0.02030L(2)在整数末尾加0作定位时,要用科学计数法表示。 例:3600 3.610 3 两位
10、 3.6010 3三位(3)在分析化学计算中遇到倍数、分数关系时,视为无限多位有效数字。(4)pH、pC、logK等对数值的有效数字位数由小数部分数字的位数决定。 H+= 6.310 -12 mol/L pH = 11.20 两位(5)首位为8或9的数字,有效数字可多计一位。例92.5可以认为是4位有效数; 二、有效数字的修约规则1. 基本规则:四舍六入五成双:当尾数4时则舍,尾数6时则入;尾数等于5而后面的数都为0时,5前面为偶数则舍,5前面为奇数则入;尾数等于5而后面还有不为0的任何数字,无论5前面是奇或是偶都入。例:将下列数字修约为4位有效数字。0.526647-0.5266 10.23
11、500-10.24 250.65000-250.618.085002-18.09 351746-35172. 一次修约到位,不能分次修约 错误修约:4.1349 4.135 4.14 正确修约:4.1349 4.133. 在修约相对误差、相对平均偏差、相对标准偏差等表示准确度和精密度的数字时,一般取12位有效数字,只要尾数不为零,都可先多保留一位有效数字,从而提高可信度三、有效数字的运算法则(一)加减法:以小数点后位数最少的数为准(即以绝对误差最大的数为准) 例: 50.1 + 1.45 + 0.5812 = 52.1 0.1 0.01 0.0001(二)乘除法:以有效数字位数最少的数为准(即
12、以相对误差最大的数为准) 0.0001 0.01 0.00001例: 0.0121 25.64 1.05782 = 0.328 RE 0.8% 0.4% 0.009%(三)乘方、开方:结果的有效数字位数不变(四)对数换算:结果的有效数字位数不变H+= 6.310 - 12 mol/L pH = 11.20 两位四、在分析化学中的应用1.数据记录:如在万分之一分析天平上称得某物体重0.2500g,只能记录为0.2500g,不能记成0.250g或0.25g。又如从滴定管上读取溶液的体积为24mL时,应该记为24.00mL,不能记为24mL或24.0 mL。2.仪器选用:若要称取约3.0g的样品时,
13、就不需要用万分之一的分析天平,用十分之一的天平即可。3.结果表示:如分析煤中含硫量时,称样量为3.5g。两次测定结果:甲为0.042%和0.041%;乙为0.04201%和0.04199%。显然甲正确,而乙不正确。 第四节 分析数据的统计处理 一、偶然误差的正态分布偶然误差符合正态分布, 正态分布的概率密度函数式:正态分布的两个重要参数:(1)为无限次测量的总体均值,表示无限个数据的集中趋势(无系统误差时即为真值) (2)是总体标准偏差,表示数据的离散程度特点:1. x =时,y 最大2. 曲线以x =的直线为对称3. 当x 或时,曲线以x 轴为渐近线4. ,y, 数据分散,曲线平坦;,y,
14、数据集中,曲线尖锐5. 测量值都落在,总概率为1为了计算和使用方便,作变量代换以u为变量的概率密度函数表示的正态分布曲线称为标准正态分布曲线(u分布),此曲线的形状与大小无关二、t分布曲线在t分布曲线中,纵坐标仍为概率密度,横坐标是统计量t而不是u。t定义为 或t分布曲线随自由度fn-1变化,当n时,t分布曲线即是正态分布。 三、平均值的精密度和置信区间(一)平均值的精密度平均值的标准偏差与样本的标准偏差(即单次测量值的标准偏差)S的关系:(二)平均值的置信区间我们以x为中心,在一定置信度下,估计值所在的范围(xtS),称为单次测量值的置信区间: Xts 我们以为中心,在一定置信度下,估计值所
15、在的范围称为平均值的置信区间:注意:1. 置信度越大且置信区间越小时,数据就越可靠2. 置信度一定时,减小偏差、增加测量次数以减小置信区间3. 在标准偏差和测量次数一定时,置信度越大,置信区间就越大四、显著性检验在分析工作中常碰到两种情况:用两种不同的方法对样品进行分析,分析结果是否存在显著性差异; 不同的人或不同单位,用相同的方法对试样进行分析,分析结果是否存在显著性差异。这要用统计的方法加以检验。(一) F检验:比较两组数据的方差(S2),确定它们的精密度是否存在显著性差异,用于判断两组数据间存在的偶然误差是否显著不同。(用来做什么?考点)检验步骤:计算两组数据方差的比值F,查单侧临界临界
16、值比较判断: 两组数据的精密度不存在显著性差别,S1与S2相当。 两组数据的精密度存在着显著性差别,S2明显优于S1。(二)t 检验:将平均值与标准值或两个平均值之间进行比较,以确定它们的准确度是否存在显著性差异,用来判断分析方法或操作过程中是否存在较大的系统误差。(用来做什么?考点)1. 平均值与标准值(真值)比较检验步骤:a) 计算统计量t, b)查双侧临界临界值比较判断:1) 当t 时,说明平均值与标准值存在显著性差异,分析方法或操作中有较大的系统误差存在,准确度不高;2) 当t 时,说明平均值与标准值不存在显著性差异,分析方法或操作中无明显的系统误差存在,准确度高。2. 平均值与平均值比较:两个平均值是指试样由不同的分析人员测定,或同一分析人员用不同的方法、不同的仪器测定。检验步骤:计算统计量t,式中SR称为合并标准偏差:查双侧临界临界值(总自由度 f =n1+n22)比较判断:当t 时,说明两个平均值之间存在显著性差异,两个平均值中至少有一个存在较大的系统误差;当t 时,说明两个平均值之间不存在显著性差异,两个平均值本身可能没有系统误差存在,也可能有方向相同、大小相当的系统误差存在。注意:要检查两组数据的平均值是否存在显著性差异,必须先进行 F 检验,确定两组数据的精密度无显著性差异。如果有,则不能进行 t 检验。