1、液化石油气分析检验质量控制的数据处理 一、有效数字及运算法则在质量检验工作中,测得的绝大部分数据是属于连续型的量,其数值的末一位一般具有一定的误差或不确定性。故对末一位数字可认为是不准确或可疑的,称为“可疑数字 或叫“欠准数字,而其前边各数所代表的数量,则均为准确知道的,称为“可靠数字。我们称此时所记数字均为有效数字。就是说有效数字是“可疑数字和“可靠数字的总称。也可以说从第一个不为零的数字开始至末位数字被称为有效数字。至于“可疑数字的欠准程度,则有1、2、5的不同约定。也有为了与数字修约规则一致,约定不超过可疑数字半个单位的,这时如果写出数字0.5就表示其真值在0.450.55之间。所谓约定
2、就是说没有统一的规定可循。在质量检验的具体工作中,一般是依据检测的具体条件决定,包括所用仪器的精度、方法的准确度等。必要时,可在观测值的后面加上欠准程度,如:原油闪点3810.003等。用观测值计算分析结果时,就要进行有效数字的运算,运算应遵守有关法则。(1)几个观测值相加减时,结果的有效数字应以各观测值的最大可疑位数为准,即以小数位数最少的为准。例如:求12.23与0.1234之和。应以12.23为准,即和应为12.35。因为12.23的小数点后第二位上的3是可疑的,即使0.1234的小数点后第三位是可靠数字,对求得的和也没有意义。9.6876的正确结果是1.5,而不是1.45314。但这个
3、规则只能说适用于一般状况,在特别状况下就不适用。确定积、商有效数字位数的普遍适用的规则,是它们的相对误差应与因数中最大的相对误差相当。(3)对观测值进行乘方和开方时,求得乘幂的位数应不超过观测值本身的位数,且幂次愈高,乘幂误差愈大,应留的位数愈少;求得方根的位数应至少与观测值本身的位数相同,且开方的次数愈高,方根误差愈小,应留的位数愈多。(4)观测值的对数小数点后所取的位数,应不多于观测值有效数字的位数。例如,按约定,对数的下限和上限是可见,对数的前四位是可靠数字,第五位欠准程度是1,可以把对数表示为五位有效数字,即(5)关于有效数字的修约,应按照国家标准GB 817087数值修约规则进行。(
4、6)在运算过程中可以多保留一位有效数字。因为偶然会发生连续“舍或连续“进 的状况而影响最后结果。当然,最后结果的位数仍应按(1)、(2)、(3)、(4)、(5)条的规定处理。把(1)、(2)、(3)、(4)四条规则概括起来可以知道,进行加、减、乘、除运算,一般都要分成三步:把各数修约到比最后结果的位数多一位。进行加、减、乘、除运算。最后对计算结果进行修约。如果在全部运算中除加、减、乘、除外还有乘方、开方、求对数的运算,则应按(3)、(4)条的规定,用求上、下限的方法确定乘幂、方根、对数有效数字的位数,再把它们纳进、三个步骤中,求出最后结果。(7)在所有计算式中,如根号2、12等数字,不连续物理
5、量的数目,以及完全从理论计算出的数字如、e等的有效数字位数可以无限制保留,需要几位就写几位。其他如相对原子质量等基本数量,如需要的有效位数少于公布的数值,可以依据需要保留。单位换算因数则需依据原单位的有效数位决定,如1kg=1000g,有效数位无限制,而气体常数R值则有一定的最高有效数位。二、准确度与精密度准确是指观测值与真值接近。观测值与真值之差叫误差。观测值与真值越接近,观测值的误差越小,观测值就越准确。因此,观测的准确度是指观测的正确性,即观测结果与真值的接近程度。在实际工作中,人们常常把某一误差很小的观测值作为“真值。例如,在定量分析中把标准样品或纯净物质的组分含量当作没有误差的真值。
6、这样,就可以把实际测得的组分含量与之比较,来衡量测定结果的准确度。精密是指一组观测值彼此符合。一组观测值彼此越接近,观测就越精密。因此,观测的精密度是指观测的重现性。精密度的凹凸不能说明观测值与真值是否接近,即精密的观测不一定是准确的,这是因为引起观测值远离真值的误差,会对一系列的观测发生相同的影响,因而无损于观测的精密度。三、误差及数据处理测量的数据常常受偶然因素的影响而变化。例如:一个化验员每日所化验的样品数;测定某个天然气样品中的硫化氢含量,在重复测量时,结果往往不同。这种受偶然因素影响而变化的量,统计工称为随机变量。数据发生变化的原因,可以全部或部分地归于测量误差,有些则是由变量固有的
7、性质所决定的。上述两个变量属于不同类型:样品数是离散型的,只能是整数,可以计数得绝对准确;而后者是连续型的,测量就会有误差。计数的数据和测量的数据统称为观测值。被测量的量在规定条件下客观存在的量值称为它的真值。实际上,真值是无法被准确知道的。因此,为了使用的特定目的,通常用与它足够接近的量值来代替,这样的量值称之为“约定真值。约定真值与真值之差对特定目的来说应该是可以忽略不计的。测量结果的误差是观测值与真值之差。观测值比真值大,误差为正;观测值比真值小,误差为负。在定量分析中,我们把标准样品给出的组分含量或给出的某项理化性能指标当作真值。实际上,这个真值是由最有经验的人,用最可靠的方法,按照严
8、格规定的程序,准确地测定出来的。有了这种公认的真值,我们就可以把测得的结果与“真值之差,作为测定结果的误差,来衡量某一分析方法的准确度,某一化验室或某一化验员技术水平的凹凸。 在实际工作中,常常以多次分析结果的算术平均值做为“真实值,与各个测定数据进行比较,这样计算出来的差值称为偏差。偏差大就是精密度低,偏差小就是精密度高。按照人们对误差掌握程度的不同,误差可分为三类,即准确掌握其数值变化规律的为系统误差;仅掌握其统计规律的为随机误差;实际上未掌握规律的为粗大误差。1)系统误差系统误差是数值变化规律已被确切掌握的误差,是由于某种常常性的原因所造成的比较恒定的误差,主要有方法误差、仪器和试剂误差
9、操作误差,它使测定结果常常偏高或常常偏低。在重复测量时,它会重复地表现出来。这种误差的大小、正负,往往可以测定出来,因而是可以矫正的。2)随机误差这是当数值变化规律未被确切掌握,但作为随机变量,其统计规律是人们所掌握的误差。这时我们已无法给出误差确实切数值。但能用均方根值或极限值等统计特征值来估计其数值的变化范围。随机误差既具有期望,又具有方差。由于期望是观察次数无限增多时函数观察平均值的极限,在理论上具有确切的数值(包括正负号),可以把它看作一项系统误差。因此对随机误差作中心化处理后,得到期望为零的随机误差。这样的误差按约定俗成的原则称之为“偶然误差。我们说误差的处理,主要指对偶然误差的处
10、理。偶然误差具有以下规律:(1)正、负误差出现的概率相等。(2)小误差出现的次数多,大误差出现的次数少,各别特大误差出现的次数极少。偶然误差的这种规律性,可用误差的正态分布曲线表示。在消除引起系统误差的一切因素以后,多次测量的算术平均值最接近真实值。也就是说多次测定取平均值的方法可以使偶然误差在均值中部分抵偿而降低。3)粗大误差(疏忽误差)这是显然超出统计规律预期值的误差。这类误差具有异常值。它的出现通常是由于测量仪器设备的故障,测量条件的失常及测量工作人员的失误而引起。带有粗大误差的数据是不可靠的。有这种误差的数据往往对数据处理结果带来显然的歪曲。因此,希望减少它们的作用。对粗大误差较妥当的
11、处理方法是重复相应试验。从总体中随机抽取的一部分个体称为随机样本,简称样本。数理统计的目的是通过样本推断总体。数据处理就是通过计算样本的统计特征数,把数据的主要特点表现出来。常用的统计特征数可分为两类:一类表征观测值的集中位置,如均值、众数、中位数等;另一类表征观测值的离散程度,如极差、平均偏差、方差、标准差等。把这两类特征数综合在一起更能说明数据的特点,如相对标准差。测量的目的在于求出被测量的真值。然而,由于误差的存在,使测量结果不等于真值,因此,只给出测量结果还不够,还必须给出测量结果与真值的接近程度。 设某被测量的测量结果为X,误差限为,则 X-X0X+ 上式说明,真值虽不能确切知道,但
12、它将落在以X为中值的X-,X+区间(称为真值置信区间)内。值越小,真值所处的量值范围就越小,即真值不能确定的程度越小。反之,值越大,真值所处的量值范围也越大。可见,值可用以评定真值所处量值范围的大小,即真值不能确定的程度。上述就是测量不确定度。不确定度按误差性质分为系统不确定度(系统误差限)和随机不确定度(随机误差限或置信限)两种。随机误差落在-,区间的概率(又称置信概率)用表示。其中,就是随机不确定度或称置信限,而区间-,称为误差置信区间。随机不确定度常表示成标准偏差的倍数形式,即=Ks 式中,s是单次测量的标准偏差K称为置信因子。当随机不确定度=3s时,误差绝对值不超出3s的概率为99.7
13、3。在测量次数不多的状况下,误差超出3s是不可能的,通常把置信概率为9.73时的随机不确定度3s,作为单次测量的极限误差。也有取随机不确定度为2.58s或1.96s作为测量的极限误差,此时对应的置信概率分别为99和95。因此,给出随机误差的极限误差时,务必指明对应的置信概率。5. 一般测量过程的数据处理步骤一般的测量过程,都是使用适当的计量器具对某量进行等精度的独立测量。等精度独立测量即每次测量的准确性相同,互相独立的测量。这类测量的数据处理步骤如下:(1)计算测量列的算术平均值。(2)计算测得值的残余误差。(3)检查算术平均值和残余误差计算的正确性。(4)计算单次测量的标准偏差。(5)判断粗大误差,剔除异常值。(6)计算算术平均值的标准偏差。(7)计算随机不确定度(用极限误差表示)。(8)测量结果的表达。通常除给出被测量的量值外,还应同时标出测量的不确定度。