1、 基于健康的推动环境空气质量标准修订 环境空气质量标准制修订方法及在上海实践Development of health-oriented standards of ambient air quality:Methodology to set and its practice in Shanghai,China 复旦复旦大学大学 公共卫生学院公共卫生学院 2022023 3.5 5.1212 School of Public Health,Fudan University May 12th,2023 目录 研究背景.1 1.我国环境空气质量标准直接借鉴 WHO 指南.1 2.我国空气质量得到明显
2、改善.1 3.WHO 及其他国家逐步收紧空气质量指南/标准.2 4.我国缺少地方性环境空气质量标准.3 项目执行情况.4 1.研究目的.4 2.研究内容.4 3.项目考核指标.4 4.项目完成情况.5 第一章 国际环境空气质量标准制/修订经验.6 1.WHO全球空气质量指南制/修订经验.6 1.1 制定准则的范围与关键问题.6 1.2 对相关研究证据进行系统综述.7 1.3 文献检测策略.8 1.4 评估系统综述研究证据的确定性.12 1.5 形成空气质量标准值.14 2.美国的环境空气质量标准制/修订经验.18 2.1 现况.18 2.2 环境空气质量标准制定流程.19 3.其他国家的环境空
3、气质量标准制/修订经验.23 3.1 加拿大.23 3.2 欧盟.24 3.3 日本.24 4.地方性环境空气质量标准制/修订经验.26 4.1 美国加利福尼亚州的空气质量标准现况.26 4.2 美国加利福尼亚州空气质量标准制修订.28 第二章 我国环境空气质量标准制/修工作流程及方法.31 1.我国环境空气质量标准发展及现状.31 1.1 我国环境空气质量标准的演变过程.31 1.2 我国环境空气质量标准修订原则与思路.33 1.3 环境空气质量标准(GB3095-1996)修订工作过程.34 1.4 我国环境空气质量标准修订方法的不足.35 2.我国环境空气质量标准制/修工作流程及方法建议
4、.37 2.1 基于健康的环境空气质量标准制/修订工作流程.37 2.2 我国环境空气质量标准制/修订具体方法以 PM2.5为例.38 第三章 PM2.5健康研究证据科学评估.46 1.我国 PM2.5健康研究证据科学评估.46 1.1 前言.46 1.2 方法.48 1.3 结果.52 1.4 结论.68 2.上海地区 PM2.5健康研究进展.71 2.1 上海地区 PM2.5短期暴露健康研究进展.71 2.2 上海地区 PM2.5长期暴露健康研究进展.74 参考文献.76 第四章 上海市 PM2.5暴露评估.82 1.上海市 PM2.5浓度历史变化趋势.82 1.1 上海市 PM2.5浓度
5、年均值的历史变化趋势.82 1.2 上海市 PM2.5浓度日均值的历史变化趋势.85 2.上海市 2022 年 PM2.5污染水平现状.86 参考文献.87 第五章 上海市 PM2.5相关的死亡负担和经济健康损失评估.89 1.数据与方法.90 1.1 数据收集.90 1.2 归因死亡数评估.90 1.3 健康经济损失评估.91 1.4 不同 PM2.5控制目标的影响评估.91 1.5 不确定性分析.91 2.结果与讨论.91 2.1 上海市各区基本信息.91 2.2 上海市各区 PM2.5污染相关的死亡负担和健康经济损失.92 2.3 不同 PM2.5控制目标的影响.95 2.4 与其他研究
6、的比较.95 3.结论.99 参考文献.100 第六章 专家访谈综述.104 1.访谈问题设置.104 2.专家访谈总结.104 阶段性研究成果小结.109 1.主要研究结论/成果.109 2.研究创新点.109 1 研究背景 1.我国环境空气质量标准直接借鉴 WHO 指南 环境空气质量标准指在一定平均时间内,环境空气污染物对特定对象(人、其他生物或生态系统)不产生不良或有害影响或影响很小的最大剂量或浓度。我国现行的环境空气质量标准于 1982 年首次发布,1996 年第一次修订,2012年第二次修订。2012 年修订标准时,重点关注调整污染物项目、限值、统计要求等一系列急需解决的突出问题。从
7、 2013 年 1 月 1 日首批城市开始实施,环境空气质量标准(GB 3095-2012)实施时间已经接近 10 年,期间针对 21 项监测标准进行了修改。中国工程院专题评估表明,标准内容总体科学、可行,在引领环境管理、促进空气质量改善方面发挥了积极作用。目前,我国环境空气质量标准制修订尚未形成体系,现行的环境空气质量标准制修订方法和流程主要参考世界卫生组织(WHO)。近年来,我国的大气污染形势发生了新的变化,为适应新时期环境空气质量管理需求,提升大气污染防治科学化、精准化水平,统筹环境保护与经济发展,有必要对我国现行的环境空气质量标准进行修订。需要结合我国大气污染防治重点,研究主要大气污染
8、物相关的人群健康效应,并进一步探索环境空气质量标准制修订方法,为确立方法体系提供支撑。2.我国空气质量得到明显改善 中国于 2013 年至今实施了大气污染防治行动计划等一系列举措,大气污染问题得到了大幅改善。以颗粒物 PM2.5、PM10为例,中国基本达到了 WHO全球空气质量标准指南(2005 年)过渡阶段 IT-1 要求,但距离实现 WHO 空气质量标准指南的指导值水平依然任重道远。2012-2017 年间,我国人口老龄化导致 PM2.5相关死亡人数增加了 34 万,大幅抵消了空气质量改善带来的保护效益相关死亡人数减少 41 万。其次,欧美等国家经过长年污染治理和相关产业转移,空气质量水平
9、达到或接近 WHO全球空气质量标准指南(2005 年),然而在上述地区仍能观测到低浓度空气污染暴露的健康危害,因此有必要加严标准,进一步保护人群健康。2 2020 年,中国宣布了 2030 年前实现“碳达峰”、2060 年前实现“碳中和”的目标,给我国空气质量的持续改善提供了巨大驱动力。有研究估算,如果我国在 2060 年完成低碳能源转型,并采取积极的大气污染控制措施,全国人群 PM2.5年均暴露水平将达到8 g/m3左右,78%的人群PM2.5年均暴露水平低于10 g/m3。在此基础上,有必要更新我国现行的环境空气质量标准。3.WHO 及其他国家逐步收紧空气质量指南/标准 自 1987 年开
10、始,WHO 定期发布基于健康的全球空气质量指南,上一个版本更新于 2005 年,近年来,环境科学领域的科学家们基于真实世界研究和流行病学研究,对于空气污染如何影响人类健康有了更清晰和全面的认识。研究证据表明,空气污染暴露可伤害儿童呼吸系统发育、诱发呼吸道感染和加剧哮喘,还可会增加成人患肺癌、缺血性心脏病、卒中等致死性疾病的风险,并可能与慢阻肺、糖尿病和退行性神经疾病存在关联。近年来,在老龄化、世界经济两极化、气候变化等发展趋势的影响下,保护人类社会的健康面临更为艰巨的挑战。为进一步降低环境大气污染物的全球公共健康风险,2021 年,WHO 基于 500 余篇学术论文提供的科学证据,修订并发布了
11、 全球空气质量标准指南(2021 年)。指南文件涵盖了 PM2.5、PM10、O3、NO2、SO2、CO 等六种主要空气污染物的指导值水平和过渡阶段目标值,前者为基于科学研究结果判断的人群暴露于空气污染引致健康风险的空气污染最低浓度值,后者基于不同空气污染浓度下健康影响的风险水平,为制定空气质量管理阶段性目标提供参考。全球空气质量标准指南适用于室内和室外环境,但是不适用于特定职业环境。基于低浓度水平健康影响的新证据,收紧了 PM2.5、PM10的长期暴露指标年均目标值,其中 PM2.5年均目标值由 10 g/m下调到 5 g/m。根据全球多中心的研究述,调整了 24 小时浓度水平与年均浓度水平
12、的比率并更新了 PM2.5、PM10的 24 小时目标值。全球尚未有国家能够全面达到全球空气质量指南(AQG)的目标要求。根据世卫组织的快速分析结果,如果将 2016 年的 PM2.5水平降低到新的 AQG 水平 5 g/m,全球与 PM2.5相关的过早死亡人数将减少近 80%。中国于 2013 年至今实施了大气污染防治行动计划等一系列举措,大幅改善了3 大气污染。以颗粒物 PM2.5、PM10为例,中国基本达到了全球空气质量标准指南(2005 年)过渡阶段 IT1 要求,但距离实现全球空气质量标准指南(2005年)指导值水平依然任重道远。在我国“双碳”战略的背景下,我国的环境空气质量标准也应
13、该向 AQG 靠拢,适当收紧环境空气质量标准。4.我国缺少地方性环境空气质量标准 目前,我国各个地区实行统一的国家标准。伴随着中国自 2013 年以来的空气质量持续改善,现行标准对于大部分已达标城市而言不再具有强有力的引领作用,以深圳为代表的领先城市已经先行对标欧盟标准,设置了更有野心的空气质量管理目标。生态环境部表示“十四五”期间的空气质量浓度改善目标考虑设置为全国地级及以上城市 PM2.5平均浓度要下降 10,也超过了现行标准限值要求的目标强度。上海作为我国经济发展水平高,空气质量改善明显的城市之一,有必要在综合考虑上海地区经济实力和管理能力等实际情况条件下,推行更加严格的环境空气质量标准
14、,将敦促上海市政府采取一系列措施治理空气污染,促进经济增长模式、产业结构和技术的转型与升级,推动清洁能源使用和绿色经济发展。这些举措与习近平总书记在联合国大会上宣布中国将致力于在 2060 年实现碳中和的目标高度一致,有助于该目标的实现。上海试点的成功经验若能推广到全国,促进全国各个地方根据各地自身情况“一地一策”地进行空气质量控制,将有望带来更大的环境、健康和经济收益。4 项目执行情况 1.研究目的 n 以 PM2.5为例,提出适合我国国情的环境空气质量标准制/修订方法,为后续标准制/修订提供技术支持。n 提出上海地区本地化标准建议,推动现阶段上海 PM2.5分级标准出台,进而促进上海地区空
15、气质量进一步改善、居民健康得到充分保护。2.研究内容 l 总结国外环境空气质量标准制/修订的方法学经验,评估我国现行环境空气质量标准的适用性及存在的问题;l 基于我国环境健康领域研究成果,以 PM2.5为例,绘制我国空气污染与健康关系的暴露反应曲线,对我国目前的标准制修订政策现状进行梳理分析,并结合我国的社会、经济、技术等因素,提出符合我国国情的环境空气质量标准制/修订的方法学及工作流程;l 遵循提出的方法学及工作流程,提出全国 PM2.5水平基准的建议值;l 选取上海作为试点城市,结合上海本地的 PM2.5与健康的暴露-反应曲线和当前的空气质量现状,经过严格的健康风险评估程序,同时考虑上海地
16、区的社会、经济、技术等因素和可接受的风险,提出上海地区 PM2.5分级标准的建议值并评估其适用性。3.项目考核指标 p 总结 WHO 制修订空气质量标准指南的方法学经验;p 总结我国环境空气污染健康研究成果,梳理我国当前环境空气质量标准制/修订工作流程,提出我国本土化工作流程和方法学,形成政策建议提交生态环境部;p 提出上海本地化 PM2.5分级标准,提交上海市生态环境局;p 形成并提交环境空气质量标准制修订方法及在上海实践研究技术报告;5 p 在项目阶段会议的基础上,组织 12 次专题研讨会和专家咨询会。4.项目完成情况 调研了 WHO 制/修订空气质量标准指南的方法学经验,并总结出一套相关
17、工作流程;梳理了美国、欧盟、加南大、日本等国家在制/修订环境空气质量标准时的工作流程和方法学经验;总结了美国加州基于全国标准制定本地标准的方法学经验;梳理了我国当前环境空气质量标准制/修订背景、原则、工作流程、方法学,并总结了其存在的不足;基于以上成果,提出了我国环境空气质量标准制/修订方法建议;调研我国环境空气污染健康研究成果,完成 PM2.5健康研究科学评估总做。完成上海市 PM2.5污染暴露评估与健康风险评估。开展 1 次专家咨询会。6 第一章 国际环境空气质量标准制/修订经验 1.WHO全球空气质量指南制/修订经验 1.1 制定准则的范围与关键问题制定准则的范围与关键问题 初步咨询是制
18、定标准的第一步,其目的是收集专家的观点及指导意见,以明确及讨论关于空气污染健康效应及减少污染暴露的干预措施的最新证据。审查内容包括有关大气污染物、方法论、暴露影响及干预研究的科学证据。确定标准制定范围包括选择空气污染物,以及选择与每个污染物的暴露时间和范围相关的重要健康结局两方面的内容。该过程包含多个步骤,需要由专家分别对污染物证据的强度,污染物-结局之间的因果关联,其他因素如健康结局的严重性、疾病负担、预期的暴露增长,结合政策进行评估。为了确定在制定标准值时需进行系统综述的健康结局,可参照 WHO 指南制定小组提出的优先级框架,基于以上优先级框架,可确定与颗粒物污染相关的健康结局:(1)优先
19、级框架)优先级框架 n 首先,应考虑关注健康结局的因果关系证据,参考标准包括加拿大卫生部、国际癌症研究机构、美国环境保护署的最新决议,以及其他科学综合评估。研究证据中的特定效应可被划分为多个级别,包括因果关系、可能的因果关系、暗示性因果关系、不适宜推断因果关系、或不太可能有因果关系。n 当未被证实具有因果关系或可能有因果关系时,应按照预防性原则考虑可能产生的最严重健康效应。考虑的因素包括:对疾病负担的贡献度(如患病率、伤残比重)、政策影响,以及未来某污染物的预期暴露增长量。n 应考虑疾病的严重程度。在某些情况下可能会对某一污染物与两个及以上不同健康结局的研究证据进行系统评估(例如,其中一个健康
20、结局与污染物之间存在因果关系或可能的因果关系,而另一种健康结局为暗示性因果关系,但该健康结局更严重,或在人群中患病率更高),此时则应取最严重的健康效应的因果关系作为参考依据。严重程度的判定参考欧洲联合呼吸学会最新提出的科学证据以及美国胸科学会关于空气污染对健康影响的政策声明(包括致死性,效应持续性,易感人群和医疗/功能意义,自主性丧失和生活质量下7 降等方面)。n 最后,应基于研究证据和专家评估,明确特定健康结局的测量方法,在标准制定过程中进行健康风险定量评估。(2)重要健康结局)重要健康结局 n 非意外总死亡;n 疾病别死亡:根据 ICD-10,纳入心血管疾病(I00-I99)、呼吸系统疾病
21、(J00-J99)及肺癌(C30-C39)。(3)其他健康结局其他健康结局 n 其他疾病别死亡、发病(门诊、急诊、住院就医)等;n 功能障碍:肺功能、心功能、血压、血脂、肾功能等;n 不良妊娠结局:早产、低出生体重等。1.2 对相关研究证据进行系统综述对相关研究证据进行系统综述 在确立制定范围后,环境空气质量标准值的制定应进一步明确需解决的综述问题,推动科学证据检索及综述形成。因此,综述问题的设定至关重要。初步提出综述问题后,由标准委员会进行判定并确立最终的综述问题。为获得制定环境空气质量标准相关的必要流行病学证据,WHO 指南制定小组建议应在明确 PECOS 框架的基础上提出综述问题。PEC
22、OS 包含五个重要元素,指的是研究人群(Population)、暴露(Exposure)、对照(Comparator)、结局(Outcome)和研究设计(Study design)。这一框架广为应用,具有丰富的内涵,具体介绍见表 1-1。8 表表1-1 PECOS 框架所包含的元素 元素元素 解释解释 P 一般人群,包含全年龄段,来自发达和发展中国家,居住在城市和农村地区的任何人群。不单独考虑职业场所以及室内环境暴露。适宜情况下,可对空气污染效应的敏感亚人群,包括已存在特定健康状况(如呼吸系统或心血管系统疾病)的人群、孕妇、新生儿、儿童或老年人的健康效应进行单独评估。E 长期(数月到年)或短期
23、(数小时到天)暴露于任何来源的空气污染物水平 C 长期(数月到年)或短期(数小时到天)暴露于任何来源空气污染物的最低水平 O 在制定标准值时,纳入考虑的与各污染物相关的健康结局 S 研究设计类型,包括队列研究和病例对照研究(长期),时间序列研究、病例交叉研究和定群研究(短期)。注:空气污染物来源同时包括室内、外环境。1.3 文献检测策略文献检测策略 为了回答提出的综述问题,应对空气质量与健康相关的文献进行调研,使用多个权威数据库(如 PubMed、Web of Science、EMBASE 等)全面检索和筛选相关文献,以确定可用的系统综述和荟萃分析结果。(1)检索策略检索策略 确定符合综述问题
24、的检索策略是系统综述的基本步骤。一般而言,需尽量提高敏感度以确保纳入文献的全面性,同时也要尽量提高特异度,保障文献检索的准确性。因此,检索词的设定应做到全面而准确。根据综述问题,可从几个方面设定检索词:中国(或中国境内各地区)、颗粒物、空气污染、健康结局。制定检索策略时,可与相关领域的专家讨论具体细节与检索词设定的问题,以确保充分检索。(2)研究证据的确定研究证据的确定 文献纳入和排除需要遵照统一标准进行,可参照 PECOS 框架制定纳入筛选标准,详见表 1-2。9 表表1-2 短期或长期暴露系统综述中文献的纳入排除标准 元素元素 纳入标准纳入标准 排除标准排除标准 P 中国全年段的一般人群(
25、包括风险人群如儿童、孕妇、老人及特定疾病患者),居住在城市和农村地区,无地理限制;主要通过吸入大气空气暴露于 PM2.5(涵盖室外和室内环境中的暴露)职业人群;暴露于单独的室内环境 E 长期(数月到年)暴露于大气 PM2.5,浓度单位为 g/m3;短期(数小时到数天)暴露于任何来源的大气PM2.5,浓度单位为 g/m3 可获得的数据少于 1 年(长期);不对共同暴露的污染物的调整情况设置排除标准 C 同一人群或对照人群暴露于目标空气污染物的最低浓度 O 全死因死亡;疾病别死亡:心血管疾病死亡(I00-I99)、呼吸系统疾病死亡(J00-J99)、肺癌(C30-C39)死亡(长期)等;发病就诊(
26、门诊、急诊、住院等);不良妊娠结局 生物标志物类指标;意外死亡;自杀 S 流行病学研究,例如前瞻性和回顾性研究,队列研究,病例对照研究和巢式病例对照研究(长期);时间序列研究、病例交叉研究、定群研究(短期);以任何语言形式(摘要为英语)在同行评审杂志上已发表(或已接收,如在印刷)的文章或相关的文献 定性研究;干预等实验性研究;缺少个体水平数据,即采用全人群水平(生态学)变量的研究;不对原始数据进行分析的研究;综述和方法学文章;不涉及人类的研究(体内、体外或其他);meta 分析中具有地理和时间交叉的研究(短期)10 需要特别说明的是,尽管干预等实验性研究(例如随机对照实验研究、非随机对照实验研
27、究等)的研究证据确定性等级相对较高,但在环境健康领域中这些研究的数量较少,而不同研究类型的研究结果难以统一用荟萃分析进行汇总,因此纳入综述的文献研究类型仍以观察性流行病学研究为主,不建议纳入实验性研究。此外,国际期刊一般以英文为主要出版语言,其他类型语言出版的研究较少,且不方便阅读和理解,因此文献的出版语言选为英语。(3)文献筛选和管理文献筛选和管理 由于不同数据库中重复收录的文献较多,因此为了减少工作量,建议使用文献管理软件(如 EndNote)对各数据库检索到的文献进行合并,并进一步剔除重复文献,减少手动筛选的工作量。此后,应对搜集到的文献进行逐一阅读和审核,严格按照预先指定的纳入排除标准
28、判定文献是否适用,这一过程应采取双人平行独立筛选的方法,即由两名审阅人分别按照统一的纳入排除标准对文献进行独立审核和评估。如果审阅人的判定评估结果不一致,则需要新增审阅人以协助评估,直至审阅人达成共识。为了确保文献筛选评估流程的完整性和准确性,应尽量逐步规范记录筛选过程中的所有步骤,包括各种文献来源、检索策略(检索词)、检索步骤、筛选标准以及每次筛选后的结果(例如筛选后的保留文献数量,筛除文献的具体原因等)。这是为了保证研究的可重复性,同时也方便对筛选过程进行核查和修正。(4)数据提取数据提取 确定纳入文献后,应按照预定的统一模板,提取所有可能需要的数据,包括文章出版信息(例如文章名称、出版时
29、间、作者、期刊名称、利益冲突声明等)、PECOS 元素(例如研究对象、研究时间、研究地区、研究设计、暴露水平、健康结局、效应值等)、以及开展偏倚风险评估(例如混杂因素)和提取空气质量标准值的必要数据(例如污染物浓度的第 5%95%分位数、均值/中位数、最小值和最大值、暴露-反应关系、暴露-反应关系的形状、作者的评估方法与结果等)。若必要的数据缺失,可考虑从初始文献中获取并进行计算,或者联系通讯作者以获得已发表研究的缺失信息。一般而言,某项研究中可能有多个效应量,若有汇总结果,则优先选择汇总结果,否则对于由分层分析和敏感性分析所涵盖的对不同人群、不同季节、不同11 滞后时间的差异性结果,可按照如
30、下情况处理:多城市研究中,若无汇总结果,而仅有对不同城市研究人群暴露于 PM2.5后的健康效应,则不同城市分别纳入,提取各城市数据;针对同一地区的研究,若仅有对不同季节或不同人群特征(年龄、性别、居住地)PM2.5暴露与健康效应之间的关联结果,则先用荟萃分析对结果进行汇总,再纳入汇总后的结果;若仅有对不同时期 PM2.5暴露与健康效应之间的关联结果,则纳入至今最近时期的结果;对于报道多个结果的研究(如同时使用单污染物模型,双/多污染物模型或其他敏感性分析),按照以下优先级框架提取结果:单污染物模型结果,即模型中只纳入了 PM2.5这一种暴露;控制混杂因素的结果;若有多个层次的调整模型,则优先选
31、择作者重点突出的模型结果(如摘要中的重要结果)。对于报道多个滞后效应的研究,按照以下优先级框架提取结果:单日滞后模型结果;若有多个单日滞后模型结果,则优先选择作者表述最多或者效应最显著的结果;若无显著结果,则优先选择效应值最大的结果,避免低估 PM2.5暴露的健康风险。(5)研究证据整合研究证据整合 当同一污染物与某一健康结局具有 3 个及以上的研究时,需进行研究证据的定量整合,采用 meta 分析进行汇总评估,获取空气污染物暴露水平每增加一个单位时的健康结局风险。否则,以定性的形式对估计效应进行描述。该步骤采用逆方差方法,假定线性的浓度-反应关系。当各研究中暴露的量度不一致时,需将数据转换成
32、同一量度进行评价,通常选为相对危险度(RR)。一般情况下,RR 表示为污染物每增加 10 g/m3时的相对风险,需将所有风险估计值表示为污染物浓度变化 10g/m3相关的健康结果的变化。尽管缺少评估暴露-反应关系形状的剂量反应 meta 分析技术,但可通过对平均污染物浓度进行分层分析,或对研究作者的决议与判断进行定性评估,以衡量潜在的线性偏差。考虑到人群及污染物成分的差异,应采用随机效应 meta 分析(最大似然比方法)对各研究中的效应值进行汇总,并通过计算 I检验和 Tau-squared 进行统计学异质性检验。I检验,I 0%,无异质性,I 25%有轻度异质性,I 50%12 有中度异质性
33、,I 75%有重度异质性。Tau-squared 也可用于评估随机效应模型中研究异质性的总量,Tau-squared 为零时表明没有异质性。如果确实存在异质性,应尝试通过亚人群分析、meta 回归或敏感性分析解释异质性来源。其他需要进行敏感性分析的情况还包括:需进行偏倚风险(RoB)评价等级告知的人群;效应值很大;研究证据的确定性存在发表偏倚;需探究多污染物模型、作者利益冲突、人群特征以及滞后模式等的影响。1.4 评估系统综述研究证据的确定性评估系统综述研究证据的确定性 该过程需对文献综述中单个研究的偏倚风险以及研究证据整体的确定性进行评估,并进一步进行因果判定。(1)偏倚评估偏倚评估 系统评
34、价中纳入的每项研究均需进行偏倚风险评估,偏倚风险评估由两名专家独立进行,当判定结果不同时,需协调结果直至达成共识,或新增专家协助评估。值得注意的是,偏倚风险的评估是在结局水平上进行评定的,若研究中报告了两种健康结局,则应对这两种结局分别进行偏倚风险评估。为了减少发表偏倚(如单城市研究中阴性结果不报告的偏倚),应尽量使用多城市(多中心)分析报告。此外,不同研究类型需使用不同方法评估偏倚风险,WHO 推荐使用 RoB法进行评估。对每个研究的 RoB 评估主要包括以下 6 个方面的考虑:混杂偏倚、选择偏倚、暴露评估、结局测量、缺失值及选择报告偏倚,判断结果包括高、中、低 RoB。每个方面下设 1 至
35、 4 个条目,若条目中有任何一个被评定为高偏倚风险,则该方面被判定为高偏倚风险;若所有条目均为低偏倚风险,则该方面为低偏倚风险;若至少有一个条目为中等偏倚风险,其他条目没有被判定为高偏倚风险,则该方面被判定为中等偏倚风险。(2)研究证据确定性分级研究证据确定性分级 在评价研究证据时,需要确定因果关系,而不仅仅是关联关系。因果关系的评价基于对某一学科内证据的一致性、各学科间证据的一致性、观察到的效应的生物学合理性以及相关不确定性的判断。因此,完成系统评价后,需评估每一对暴露-结局的证据质量,以助于确定环境空气标准值。评估研究证据的确定性是进行系统综述的重要环节,主要关注效应估计值的有效性和精确性
36、。效应估计值的确定性可分为高、中、低、极低四类。研究证据的初始确定性水平由其研究类13 型决定,其中随机对照试验初始水平被设定为高确定性,非随机实验初始为低确定性。随机和非随机研究均可以通过 5 个方面的评估对确定性进行降级,而非随机性研究还可通过 3 个方面的评估进行确定性升级。【确定性降级】n 研究证据存在缺陷或偏倚风险:降 1 级或 2 级 n 研究证据不直接,研究未能按照 PECOS 标准严格纳入研究人群:降 1 级或2 级 n 研究结果不一致,存在严重异质性:降 1 级或 2 级 n 累积效应估计不精确,研究样本量不足:降 1 级或 2 级 n 研究证据存在发表偏倚:降 1 级【确定
37、性升级】n 累积效应估计值较大:升 1 级 n 所有可能的混杂和偏倚均使累积效应估计值朝无效应的方向偏倚:升 1 级 n 存在剂量反应关系:升 1 级 由于观察性研究(队列研究、病例对照研究、病例系列报告及其他数据来源)存在很多未被测量的混杂,初始被设定为中度确定性。此外,有必要对证据进行更细致的审查,以及按照以下附加标准完善或替换现有准则:n 计算 80%的预测区间,可和 95%置信区间一起进行异质性评估;n 基于特定的相对危险度(RR)及可信区间计算某研究需要的样本量,以评估不确定性;n 使用 E 值(E-value)评估混杂可能对累积效应值产生影响的程度;n 附加的评估发表偏倚的方法,例
38、如基于时间序列研究证据,比较多中心研究中的亚群分析结果与单城市研究的结果;n 早期与后期研究效应估计的差异分析;n 以及比较已发表结果,以量化偏倚强度。(3)因果判定因果判定 因果关系判定基于所筛选的文献,根据系统评价和荟萃分析方法完成。简单来说,该评估基于对来自健康和环境影响学科的不同证据线的调查结果的整合,最终形成关于因果关系的定性陈述。根据因果关系判定的五个层级结构,对健康14 影响的证据权重可分类为:因果关系、可能的因果关系、暗示性因果关系、不适宜推断因果关系、或不太可能有因果关系:n 因果关系:根据包含多条证据线的研究,污染物已被证明在相关的暴露中会导致健康影响,并且可以以合理的信心
39、排除偶然性、混杂和其他偏倚;n 可能的因果关系:有些研究的结果不能用机会、混杂或其他偏倚来解释,但健康影响的证据总体上仍有不确定性。例如,很难解决共同出现的污染物的影响,或者跨学科的证据可能是有限的或不一致的;n 暗示性因果关系:健康影响的证据总体上支持但不完全一致,不能排除偶然性、混杂和其他偏倚的影响,不足以推断出因果关系;n 不适宜推断因果关系:健康影响的研究结果在数量、质量、一致性或统计能力方面不足,无法推断存在或不存在因果关系;n 不太可能有因果关系:若干充分的健康影响研究,检查了全部预期的暴露浓度以及对健康影响、潜在的高危人群和生命阶段的研究,一致显示没有健康影响。1.5 形成空气质
40、量标准值形成空气质量标准值(1)综合研究证据判定文献综合研究证据判定文献 综合以上评估过程,对筛选的文献进行进一步判定,包括:【排除不符合要求的健康结局】n 排除无显著性的健康结局;n 排除荟萃分析结果异质性过高(如 I2 75%)且无合理解释的健康结局;n 排除证据确定性等级低或极低的健康结局;n 排除因果关系判定层级低的健康结局。【根据纳入的健康结局进一步排除文献】n 排除没有 PM2.5暴露分布第 5 百分位数结果的长期暴露研究;n 排除没有 PM2.5暴露分布第 99 百分位数结果的短期暴露研究;n 若合并效应值有显著性,排除效应值不显著或效应值与合并效应值方向相反的研究。(2)确立确
41、立标准值标准值 标准值包含以数月至数年为衡量单位的长期暴露污染物浓度及以数小时或 15 数天为衡量单位的短期暴露污染物浓度。长期暴露研究结果协助制定年均 PM2.5浓度,短期暴露研究结果协助制定 24 小时日均 PM2.5浓度。因此,需分别确定年平均和 24 小时平均标准推荐值。【长期标准值】长期标准值的定义为:确信可致使不良健康效应的空气污染物的最低暴露水平。其中,“确信”是指该特定污染物与特定健康结局之间的关联证据应具有高度或中度确定性。此外,对于某些低于中等确定性的研究证据,出于预防性原则,尤其是当暴露分布范围广,以及人群效应非常严重时也应进行考虑。长期标准值的确立目的是为了降低空气污染
42、物长期暴露的不良效应,为降低疾病与死亡提供建议。具体步骤可参照表 1-3。表表1-3 形成长期标准值的八个步骤 步骤步骤 具体内容与解释具体内容与解释 第一步第一步 做法:评估系统综述中 PM2.5暴露与重要健康结局之间的 RR 和暴露-反应关系。说明:(1)重要健康结局包括:短期或长期暴露相关的全死因死亡(或全部的自然原因死亡,排除意外死亡)、呼吸系统疾病死亡、心血管疾病死亡、肺癌死亡。(2)原则上,只有当某特定暴露-结局相关研究证据的随机效应 meta分析 RR 值的 95%置信区间不包含 1 时,该效应评估才会被采用。当存在边际显著或者研究效应仅在某些主要亚群中显著时,将进一步考虑是否将
43、其纳入其中。尤其是当随机效应 meta 分析双边检验的 p值小于 0.1 时,应慎重考虑。(3)此外,应满足研究证据具有中到高度确定性的要求。第二步第二步 做法:确定系统综述中所包含文献的最低暴露水平。说明:(1)建议选取多个“最低暴露水平研究”(例如暴露浓度最低的 5 篇文献),分别将其污染物浓度分布的第 5 百分位数(P5)作为各自的起点。(2)当某研究中浓度分布的 P5 对应效应估计值的置信区间均较宽16 时,可以选择更高的百分位数作为起点。(3)对每个使用统计模型评估暴露-反应关系曲线形状的研究,确保最低浓度与暴露-反应关系曲线的单调递增有关。第三步第三步 做法:确定健康结局的最小相关
44、增量。说明:通常以“0”为基线判断风险增加与暴露有关。第四步第四步 做法:将可引起最小相关健康结局增量的暴露水平作为标准起始值。说明:(1)长期:将多个“最低暴露水平研究”中浓度 P5 的均值作为标准值起点;(2)短期:日浓度第 99 百分位数与对应的年度标准值水平 第五步第五步 做法:比较同一污染物与各重要健康结局之间的标准值。说明:(1)按照第 1-4 步中的方法对同一污染物与多个重要健康结局之间的标准值进行评估,取最低标准值作为最终推荐的标准。(2)避免个别健康结局的评估水平低于全因死亡率 第六步第六步 做法:评估低暴露水平研究证据的确定性。说明:(1)应对全体证据进行分级评估,而不是只
45、在“最低暴露水平研究”中进行;(2)需要对每个“最低暴露水平研究”的 RoB 评估结果进行讨论,如果某研究具有高 RoB,则应被排除,除非有合理的理由同意纳入;(3)还应考虑在最低暴露水平进行的研究是否表现出 RR 增加的趋势;(4)对于证据较少的研究,因未开展证据确定性分级评估需进行讨论。第七步第七步 做法:采用定性或者定量的方式对不在系统综述中的新证据进行评估。说明:评估新证据是否符合已包含的研究。第八步第八步 做法:进一步考虑污染与结局之间的因果关联。说明:是否被 COMEAP、加拿大卫生部、美国环境署、WHO 及其他权威机构定义为因果关系或者可能的因果关系。17 【短期标准值】由于 P
46、M2.5的日均或小时均值通常满足对数正态分布,且短期变异受气象因素影响较大,短期标准值通常被定义为日均浓度分布的高位百分位数,例如第 98或者第 99 百分位数,分别表示一年中有 7 天或者 3 天超过该浓度(出于稳定性的考虑,不选最大浓度)。对于浓度分布低于年均标准值水平的地区,其具有高日均浓度的天数往往较少,而大多数情况下日均浓度均低于年均标准值水平。由于长期暴露水平每变化一个单位对应的健康效应较短期暴露更强,长期标准值对短期暴露时的多个健康结局均有保护作用,因此,可通过提取长期标准值来制定同一污染物-结局的短期标准值。除了第三步“确定健康结局最小相关增量”有所差异,表 1-3 中形成长期
47、标准值的程序对于形成短期标准值仍然有效。通常,可将满足“均值与长期标准值相等”的日空气污染浓度分布的第 99 百分位数作为 PM2.5暴露-结局的短期标准值。该方法适用于全死因死亡、疾病别死亡与 PM2.5。根据短期与长期研究证据的出现情况,通常可将 PM2.5暴露-结局划分为两类场景,详见表 1-4。表表1-4 短期暴露 PM2.5-结局场景及相应短期标准值计算方法 场景场景 描述描述 场景一场景一 描述:存在 PM2.5暴露与同一健康结局的长期标准值。说明:(1)短期和长期标准值需保持内部一致性,长期标准值水平可以保护严重的短期死亡;(2)根据既往研究报道,PM2.5的 24 小时平均浓度
48、分布的第 99 百分位数为年均浓度值的 N 倍(例如 3 倍),则短期标准值定义为长期标准值*N。场景二场景二 描述:存在该污染与其他健康结局之间的长期标准值。说明:PM2.5的长期和短期标准值均基于全死因死亡和大量疾病别死亡。大多数情况下这些结果均来自于同一个研究,因此可以认为,在自然原因死亡和疾病别死亡最低暴露水平研究中的 PM2.5浓度的第 5百分位数无严重差异。通常认为短期或长期疾病别死亡的效应估计要高于全死因死亡。18 当同时存在 PM2.5暴露-结局的短期和长期标准值时,可以长期标准值为参考,根据先验污染物的 24 小时均值分布情况,匹配短期标准值。当 PM2.5的暴露-结局仅存在
49、短期标准值时,可将 PM2.5与其他污染-结局进行类比。基于以上程序可以得到一个标准起点值,但该起点并不意味着没有效应,而仅代表现有关于低于该浓度时的效应值证据确定性较低。对于该值,需要由环境健康领域专家及其他相关利益者,针对报告内容和标准值进行讨论分析,进一步确定标准值。(3)不确定性评价不确定性评价 在评价 PM2.5暴露相关的人群健康影响时,针对 PM2.5暴露与健康结局暴露-反应关系特征的研究已成为环境流行病学研究的重点和难点问题之一。暴露-反应曲线在现行空气质量标准水平及以下的形状仍有待探索。究其原因,暴露和效应评价过程中的各类不确定性,例如客观存在的暴露测量误差、低浓度暴露水平下的
50、数据密度较低、暴露与健康效应的关联存在个体差异等,往往使得暴露-反应关系线性化,这可能掩盖了效应值起点(阈值)或非线性关系的存在。甚至由于个体差异,如遗传差异或预先存在的疾病状况,个体阈值也因人而异(对某一特定个体而言,这一阈值在个体不同生命时期也会有所不同),在人群研究中可能很难证明存在阈值。因此,即便 PM2.5暴露导致健康结局的生物学机制显示某些关键分子事件可能存在一些非线性关系,在现有环境浓度下的健康数据可能也并没有表现出健康影响的阈值。在标准制定过程中,不确定性可能来自于每一个研究步骤,原始研究的方法和数据分析、文献检索统计、文献筛选及标准值推导的全过程可能都存在不同程度的不确定性。