收藏 分销(赏)

基于数理统计方法的水质总氮校准曲线残差值检验.pdf

上传人:自信****多点 文档编号:2984621 上传时间:2024-06-12 格式:PDF 页数:6 大小:1.18MB
下载 相关 举报
基于数理统计方法的水质总氮校准曲线残差值检验.pdf_第1页
第1页 / 共6页
基于数理统计方法的水质总氮校准曲线残差值检验.pdf_第2页
第2页 / 共6页
基于数理统计方法的水质总氮校准曲线残差值检验.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 年 月云南化工 第 卷第 期 ,:基于数理统计方法的水质总氮校准曲线残差值检验杨玉凤(昆明滇池水务环境监测有限公司,云南昆明 )摘要:(目的)探讨水质总氮校准曲线残差值的正态性、独立性、同方差性。(方法)一年内对不同浓度的硝酸盐氮标准使用液进行了 次测定,对测定结果进行校准曲线拟合,计算残差值。通过 图及 ()法检验残差值的正态性;通过图示法及 法检验残差值的独立性;通过残差图及等级相关系数法检验残差值的同方差性。结果表明,该曲线残差值满足正态性,不满足独立性和同方差性。(结论)使用普通最小二乘法对数据进行曲线拟合需建立在一系列假定条件上,因此实际工作中不能盲目默认相关假定条件成立,应将数理

2、统计理论与化验检测实际相结合,保障曲线拟合的可靠性。关键词:校准曲线;残差值;正态性;独立性;同方差性中图分类号:文献标识码:文章编号:()(,):,();,:;在化验检测的实践过程中,最重要的一点是要采取有效措施保证所得到的数据和资料的可靠性。现代化验检测工作中,绝大多数使用仪器分析方法,一些仪器需要建立分析信号与分析物量值(质量或浓度)之间的相关关系,即建立校准曲线。其中,确保用于建立校准曲线数据的可靠性是仪器分析获得准确定量分析结果的前提条件。校准曲线的拟合是建立在回归分析的理论基础上,通过最小二乘法估计其参数。采用普通最小二乘法拟合校准曲线应满足以下假设条件 :正态性假设,即其因变量

3、的随机误差项 服从均值为,方差为 的正态分布;独立性假设,即其因变量 的随机误差项之间相互独立,满足 (,)();同方差性假设,即其因变量 的随机误差项 的方差都相同。由于校准曲线估计结果的正确性与可靠性需建立在一系列假定基础之上。为此,本文从工作需要出发,利用实际工作中所得数据,结合文献资料,以水质中总氮测定为例,着重对校准曲线残差值各假定条件的检验方法进行探讨。材料与方法 仪器与试剂 紫外可见分光光度计(北京普析通用仪器有限公司),用于水质总氮的测定。硝酸盐氮溶液():证书号 ,相对扩展不确定度 ,环境保护部标准样品研究所提供。实验方法总氮检测方法依据为 水质 总氮的测定 碱性过硫酸钾消解

4、紫外分光光度法 。数据的收集及检验 数据收集依据 基于标准样品的线性校准 规定:每个标准样品应至少测量 次(建议实际中尽可能多次重复);所有标准样品的重复测定数应相等;重复测量所用时间和条件的覆盖范围应尽可能放宽,以确保所有操作条件的代表性。年 月云南化工 第 卷第 期 ,本文数据来源于 年内对总氮项目不同质量浓度硝酸盐氮标准使用液进行 次测定,数据收集结果见表 。各曲线点一年内累计的残差值,结果见表 ,残差值样本量 。表 各质量浓度点 次测定所得数据及曲线拟合质量浓度 ()平均值 拟合值 斜率 截距 判定系数 注:,;测定时间为 年月,测定时间为 年月,测定时间为 年月,测定时间为 年 月,

5、测定时间为 年 月,测定时间为 年 月。表 残差值汇总 备注:正态性检验一般情况下,如果因变量的随机误差项 是由许多微小的独立随机因素影响的结果,那么就可以认为具有正态分布。一般检测中,在进行校准曲线的拟合时,总是假定数据来源于正态总体,但此假定是否成立,需要对测得数据进行正态性检验。本文将介绍 图法,该方法可直观的判断数据分布是否近似于正态分布,同时介绍 法,该方法通过计算出检验统计量 来检验数据是否服从正态分布。表 及 汇总 年 月云南化工 第 卷第 期 ,图法对应于正态分布的 图,是由标准正态分布的(修正)分位数为横坐标,样本值为纵坐标绘制而成的散点图。要利用 图鉴别样本数据是否近似于正

6、态分布,只需看 图上的点是否近似地在一条直线附近 。本文操作步骤为 :将残差值按升序 排列;计算()();根据 ()值,通过 函数“”求出标准正态分布的(修正)分位数,列于表 中;依据表 的数据,以 为横坐标,为纵坐标绘制图。由图 看出,各点近似地在一条直线附近,说明该样本残差值服从正态分布。图 图 检验法 检验是正态性检验的一种,能够在较小样本()的情况下,对数据正态性进行检验。其原理是通过计算样本分布函数()和经验概率密度函数()之间的二次 距离来衡量样本是否属于某一特定分布族 。本文操作步骤为:假设该样本残差值服从正态分布(原假设);将残差值 按照升序 排列为;计算残差值的均值和方差;计

7、算累计分布函数 ();通过公式()计算;通过公式()计算修正过的检验统计量 ;查 检验临界值表,如果 就可判定在 的显著性水平下拒绝正态性假设,如果 ,就可判定在 的显著性水平下不能拒绝正态性假设。用于计算 的数值见表 ,最终结果为 ,小于 ,可判定在 的显著性水平下不能拒绝正态性假设,此结论与绘制 图所得结论一致。()()()()()()表 检验计算数据 ()()()()()()独立性检验本文将介绍图示检验法,该方法可直观地对数据独立性进行判断。同时介绍 检验法,该方法通过计算出检验统计量 值,从而检验数据是否存在序列相关。需要注意的是,回归模型中残差值之间出现自相关现象,指的是残差值前后期

8、数值之间的相关关系 。图示检验法图示检验法是一种直观的诊断方法。本文操作步骤为:将残差值 按测定时间 的先后顺序进行排列,以表 中的 表示;依据表 中数据(,年 月云南化工 第 卷第 期 ,)绘制图 。如果大部分点落在第 、象限,表明残差值存在正的序列相关;如果大部分点落在第 、象限,表明残差值存在负的序列相关 。图 中大部分点落在 、象限,但也有部分点落在 、象限,初步推断残差值存在正的序列相关,需进一步通过 检验进行验证。表 (,)数据 备注:图 (,)散点图 检验法 统计量只可检验残差值具有一阶自回归形式的序列相关。本文操作步骤为:假设残差值不存在序列自相关(原假设);应用表 中数据,通

9、过公式()计算得 值为 ,通过公式()计算得 值为 ;根据样本量为 ,解释变量数目为 ,在 的显著性水平下查 分布表,确定检验临界值 为 ;查 检验判别表 ,当 时,否定原假设,表明残差值存在正序列相关,使用 检验法进一步验证了图示法的检验结果。槡 槡()()()同方差性检验异方差是与同方差相对而言的,同方差即是指线性回归模型的随机干扰项的方差全部等于一个有限的常数,而异方差现象可表述为线性回归模型中随机干扰项的方差不再是某一相等的常数,而是随着观察点的变化而变化 。对异方差的检验,本文将介绍残差图法,该方法可对异方差现象进行直观判断。同时介绍等级相关系数法,该方法通过计算出等级相关系数,随后

10、计算 统计量,从而检验数据是否存在异方差现象。残差图法残差图反映出的现象一般非常简单、直观,但因每个人的主观判断不同,残差图只能作为一种非正式的检验方法。本文操作步骤为:依据表 中数据,以残差值 为纵坐标,以自变量 为横坐标绘制散点图,得图 。根据各点的分布情况判断是否出现异方差现象,如果校准曲线残差值 存在异方差性,残差图上各点的分布会呈一定的走势,例如残差 的值随 值的增大而增大(或减小),呈现出明显的规律。由图 看出,随 值的增大图中各点的离散程度有增大的趋势,说明有可能存在异方差现象,但需进一步使用等级相关系数法进行验证。年 月云南化工 第 卷第 期 ,图 残差图 等级相关系数法等级相

11、关系数法使用的是非参数检验方法 ,其思路是将异方差性与扰动项 和自变量 之间的相关程度挂钩 。由于扰动项无法观测,就用残差值 代替。本文操作步骤为:取 的绝对值 ,把数据对(,)按序号 排列于表 中。通过 函数“”,分别计算,的等级秩次 、。在 与 中无相同秩次的情况下,按式()计算等级相关系数;在 与 中有相同秩次的情况下,按式()()计算等级相关系数 。由于本文中 与 中有相同秩次,应用表 中数据按式()()计算等级相关系数,得 校正 。假设残差值 与自变量 之间无相关(原假设)。对等级相关系数 校正进行显著性检验,按照式()计算得 ,查 分布临界值表,得 ,拒绝原假设,说明该样本残差值存

12、在异方差现象。等级相关系数法的检验结果对残差图检验法的判断结果进行了有效佐证。()()()校正 ()()()()槡()()()校正槡槡校正()表 等级秩次数 备注:为的等级秩次;为 的等级秩次 讨论 正态性假设相关问题采用普通最小二乘法拟合校准曲线,在其它假定条件满足时,非正态性对最小二乘法估计和总变异的分解影响不大,其结果仍是最优线性无偏的,但将对参数估计值的著显性检验和置信区间的估计带来影响 。若检验发现因变量 的随机误差项 不服从正态分布,通常采用对因变量 进行变换的方法,将其数据转换成正态分布。但同时需注意,在数据转换时已将数据蕴含的原始信息进行了改变,由此得到的曲线回归结果,其参数的

13、解释意义已和变换前有所不同。独立性假设相关问题一个线性回归模型的随机误差项 存在序列相关 年 月云南化工 第 卷第 期 ,时,如果仍然使用普通最小二乘法估计未知参数,将会产生如下后果 :参数的估计值不再具有最小方差线性无偏性;均方误差()可能会严重低估误差项的方差;容易导致对回归方程进行检验的 检验和 检验失效;最小二乘估计量对抽样波动非常敏感;利用回归模型进行预测和结构分析将会带来较大的方差甚至错误的解释。当线性回归模型的随机误差项 存在序列相关性时,需要查明引起随机误差项 产生序列相关性的原因:如果是因回归模型选用不当,则应该改用适当的回归模型;如果是因缺少重要的自变量,则应该增加自变量;

14、如果以上两种方法都不能消除随机误差项 的序列相关性,则需采用迭代法、差分法等方法进行处理。同方差性假设相关问题一个线性回归模型的随机误差项 不满足同方差性,即存在异方差现象时,仍使用普通最小二乘法估计回归参数,将会出现的问题 :参数估计虽然是无偏的,但不是最小方差线性无偏估计;参数显著性检验失效;回归方程应用效果不理想。线性回归模型的随机误差项 存在异方差性现象时,可采用以下两种方法进行处理:对因变量 作适当的变换,使方差趋于稳定。这是由于因变量的变化范围愈大,随机误差项的异方差性一般也愈明显,因此,采用适当形式缩小因变量 的变动幅度,可在一定程度上消除异方差性 。使用加权最小二乘法进行校准曲

15、线拟合。校准曲线拟合优度检验相关问题由于在实际检测过程中,线性校准曲线两端,即高浓度和低浓度范围内有时会出现不同程度的弯曲,影响校准曲线预测的准确性,因此需要对该现象进行检验,即进行校准曲线拟合优度的检验,从而确定校准曲线的直线范围。基于标准样品的线性校准 介绍了通过建立方差分析()表的方式,对校准曲线拟合优度进行检验。同时提到随机误差项 的正态性及独立性影响到方差分析法的有效性。因为对单因素多水平设计定量资料进行一元方差分析的前提条件是定量数据应具有独立性、正态性和方差齐性 。因此,对校准曲线拟合优度进行检验前,需对该曲线随机误差项 的独立性、正态性和方差齐性进行验证,以保障校准曲线拟合优度

16、检验的可靠性。结论一般检测过程中人们重点关注校准曲线的判定系数,本文中校准曲线判定系数 ,已满足相关标准 要求,但由上文检验结果可以了解到该曲线残差值满足正态性,不满足独立性和同方差性,而不满足相关假设条件将会产生一系列不良后果。故检测工作中,检测人员在采用普通最小二乘法拟合校准曲线时,应考虑到应用普通最小二乘法的前提假设条件是否满足,不能盲目默认相关假定条件成立,应将数理统计理论与化验检测实际相结合,保障曲线拟合的可靠性。同时,应该注意到对相关假定条件进行检验时,图示检验法一般比较简单直观,但存在各人主观判断差异的问题,而通过计算统计量值的方法,可以得到定量的判断依据,避免了因主观判断引起的

17、误差。参考文献:卢冶飞,孙忠宝 应用统计学 版 北京:清华大学出版社,何晓群,刘文卿 应用回归分析 北京:中国人民大学出版社,水质总氮的测定碱性过硫酸钾消解紫外分光光度法:北京:中国环境科学出版社,基于标准样品的线性校准:北京:中国标准出版社,李玉梅 数据的正态性检验方法 怀化学院学报,():陈军 数据的正态性检验及 软件的实操应用 四川职业技术学院学报,():张维,于盛林,张弓 检验在杂波分布辨别中的应用 仪器仪表学报,():王业英 序列相关检验简介 中国卫生统计,():刘明 基于一元线性回归模型异方差对加权最小二乘法的考察 统计与决策,():高辉 异方差性的诊断方法及数据属性影响的实证分析 山西师范大学学报(自然科学版),():王军 回归模型异方差性分析 科技和产业,():何艳频,孙爱峰 等级相关系数计算公式及其相互关系的探讨 中国现代药物应用,():张风雨,富振英 最小二乘法回归中的一些问题 数理统计与管理,():曾伟生,骆期邦,贺东北 论加权回归与建模 林业科学,():胡纯严,胡良平 如何正确运用方差分析 单因素多水平设计定量资料一元方差分析 四川精神卫生,():收稿日期:作者简介:杨玉凤(),女,云南昆明人,环境监测工程师,主要从事水质和污泥检测分析工作。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服