1、引文格式:李泽芝,王新刚.镇域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能对比研究J.西北地质,2024,57(1):111.DOI:10.12401/j.nwg.2023159Citation:LI Zezhi,WANG Xingang.Comparative Study on Evaluation Performance of Different Units of Susceptibility ofAccumulation Layer Landslide in Qinba Mountain Area at Town ScaleJ.Northwestern Geology,2024,57(
2、1):111.DOI:10.12401/j.nwg.2023159镇域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能对比研究李泽芝,王新刚*(大陆动力学国家重点实验室,西北大学地质学系,陕西 西安710069)摘要:秦巴山区堆积层滑坡数量多、分布广、密度大、频次高,所造成的危害十分严重,且具有孕灾条件复杂多样和部分灾害评价数据获取难度大等特征。笔者选取秦巴山区小岭镇作为研究区,在地质灾害野外调查基础上,结合堆积层滑坡区域特点,采取栅格、斜坡两种单元类型,因地制宜的提取了滑坡孕灾因子,分析其相关性,提选出坡度、坡高、坡面形态、斜坡结构类型、堆积层厚度、距道路、矿区、断裂的距离等 8 个因子作为堆
3、积层滑坡特征因子,运用随机森林模型方法对该镇域进行了滑坡易发性评价;并通过评价结果频率比、ROC 曲线、易发性概率均值与标准差,对栅格单元、斜坡单元两种单元类型的精度与准确性进行了验证,结果表明:两种评价单元的预测结果都有良好的表现,但斜坡单元作为评价单元总体预测性能高于栅格单元,栅格单元在灾害防治具体空间部署上有着更精细的参考。研究成果对秦巴山区镇域地质灾害风险评价工作有一定的理论和实践意义。关键词:易发性;堆积层滑坡;随机森林;单元评价;秦巴山区中图分类号:P694文献标志码:A文章编号:1009-6248(2024)01-0001-11Comparative Study on Evalu
4、ation Performance of Different Units of Susceptibility ofAccumulation Layer Landslide in Qinba Mountain Area at Town ScaleLI Zezhi,WANG Xingang*(State Key Laboratory of Continental Dynamics,Department of Geology,Northwest University,Xian 710069,Shaanxi,China)Abstract:The accumulation layer landslide
5、s in Qinba Mountain area are abundant,widely distributed and fre-quently,and the harm caused by them is very serious.Moreover,it is characterized by complex and diverse dis-aster pregnancy conditions and difficult to obtain some disaster evaluation data.Xiaoling Town,Qinba Moun-tain,was selected as
6、the research area.The geological hazard field survey was taken as the basis.Combined withthe regional characteristics of accumulation landslide,two element types,grid element and slope element,are 收稿日期:2023-02-01;修回日期:2023-04-19;责任编辑:贾晓丹基金项目:国家自然科学基金项目“灌溉区黄土干湿循环劣化后蠕变特性及其促滑机理研究”(41902268)资助。作者简介:李泽芝(
7、1998),男,硕士研究生,主要从事滑坡调查与机理研究。Email:。*通讯作者:王新刚(1984),男,教授,博士生导师,主要从事地质灾害机理与防控研究。Email:。第 57 卷 第 1 期西 北 地 质Vol.57No.12024 年(总 233 期)NORTHWESTERN GEOLOGY2024(Sum233)adopted.The landslide hazard factors were selected according to local conditions,and their correlation was ana-lyzed.Eight factors,includin
8、g slope,slope height,slope morphology,slope structure type,accumulation layerthickness,distance from road,mining area and fault,are selected as the characteristic factors of accumulationlayer landslide.The random forest model method was used to evaluate the landslide susceptibility of the townarea.I
9、n addition,the accuracy and accuracy of grid element and slope element were verified by frequency ratio,ROC curve,mean value and standard deviation of susceptibility probability of evaluation results.The resultsshow that both evaluation elements have good performance in the re-prediction results,but
10、 the overall predic-tion performance of slope element as evaluation element is higher than that of grid element.In the specific spa-tial deployment of disaster prevention and control,more detailed reference comes from grid element.The re-search results have certain theoretical and practical signific
11、ance for the risk assessment of geological hazards intowns in Qinba Mountains.Keywords:susceptibility;landslide of accumulation layer;random forest;unit evaluation;Qinba Moun-tains秦巴山区地质构造强烈,地形起伏大,地貌形态与岩土体结构类型复杂多样,岩体节理裂隙发育,风化严重,降雨丰富,人类工程活动活跃,导致区内灾害频发,尤其是以第四纪堆积层滑坡为主的地质灾害(隐患)具有数量多、分布广、密度大、频次高等特点,所造成的危
12、害严重,是中国地质灾害的重灾区之一(强菲等,2015;赵力行等,2020;刘伟等,2021)。因此,秦巴山区堆积层滑坡具有孕灾条件复杂多样、部分灾害评价数据获取难度大等特征(张世林,2020),如斜坡堆积层厚度、斜坡结构类型。滑坡易发性评价模型建立流程为:区域滑坡数据及孕灾条件编录评价因子提取与选择评价模型选取模型参数推定评价结果精度验证与分析等步骤,可见评价模型是十分重要的一环,关乎评价结果的准确性与可信度(黄发明等,2022)。目前滑坡易发性评价模型主要分为知识驱动模型、物理驱动模型、数据驱动模型 3 类,其中,数据驱动模型以区域基础环境因子为数据输入,通过机器学习模型、数理统计模型等得到
13、评价结果(Saro Lee et al.,2015;张林梵等,2022)。据研究表明,机器学习模型的预测性能明显高于数理统计模型与传统的知识驱动模型,其中随机森林模型在预测精度、提高泛化能力等方面较其他机器学习模型有着更好的表现,如 Merghadi 等(2018)以北非米拉盆地为例,比较了基于随机森林、梯度提升机、逻辑回归、神经网络和支持向量机种评价模型下滑坡易发性的预测结果,得出随机森林模型预测性能更高的结论。目前,滑坡易发性评价时所使用区划单元类型主要为栅格单元与斜坡单元(田述军等,2019;常志璐等,2023)。栅格单元区划在空间上破坏了评价区域斜坡的自然属性,但划分时操作简单,在给单
14、元赋值时有更强的唯一性,信息损失较少;斜坡单元划分时相较于栅格更复杂,给单位赋值时可能造成信息损失,但能够很好的反应区域滑坡易发性的地形分布情况,对某些基于斜坡的特征因子有更好的表征,如斜坡结构、堆积层厚度等。近年来,随着 110 000 地质灾害风险评价的开展,评价区域的尺度也转向镇域级,意味着对地质灾害风险区的划分有了相对县域级评价更高的精度要求,主要表现在对全域内每个斜坡孕灾地质条件的掌握(陕西省自然资源厅,2021)。不同地质环境背景下滑坡的主要孕灾因子不尽相同(黄润秋等,2007),如黄土地区由于土体的水敏性、灌溉等因素所致滑坡较为普遍(段钊等,2018),故土地利用类型为黄土地区滑
15、坡易发性评价的重要因子;而秦巴山区多以堆积层碎石土基岩的二元结构斜坡为主(范立民等,2004;唐睿旋,2017)层间的渗透性差异使该地区以堆积层滑坡为主,故堆积层厚度为堆积层滑坡易发性评价的重要因子。基于上述分析,笔者选取秦巴山区柞水县小岭镇作为典型研究区,结合堆积层滑坡特点,采取栅格单元、斜坡单元两种单元类型,运用随机森林模型方法对该区域进行了滑坡易发性评价与精度分析,得到镇域滑坡空间概率,并探讨易发性评价在两种划分方法下的差异,研究成果对当地政府部门的减灾防灾措施部署等具有重要意义。2西北地质NORTHWESTERN GEOLOGY2024 年 1研究区及模型特征因子分析 1.1研究区概况
16、小岭镇地处秦巴山区腹地(图 1),区内地形陡峭、沟壑纵横,其地质构造受东西展布的山阳凤镇等深大断裂影响较大,其滑坡孕灾条件也较为复杂:区域内斜坡以二元结构的陡坡为主,丰富的矿产资源与稀少的平缓地带,不可避免的形成了区内削坡建房频繁、切坡修路密集、毁林造地普遍、矿山开发持续的现象,这些现象导致了斜坡开挖形成临空面致使开挖处剪应力集中,加之堆积层大都为渗透性强的松散碎石土,矿区附近更有矿渣堆积使得堆积层自重增大,孔隙水压力增强,导致堆积层滑坡在研究区内极易发育,经统计发现(表 1),研究区地质灾害以堆积层滑坡为主,占区内滑坡的 92.86%,主要分布在道路两侧的陡坡处(图 2)。1.2随机森林模型
17、简介随机森林是一种集成 Bagging 算法,可用于分类问题与回归问题(方匡南等,2011)。在分类问题中,旨在生成众多决策树,并通过对建模数据集的样本观测和特征变量分别进行随机抽样,每次抽样结果均为一棵树,且每棵树都会生成符合自身属性的规则和分类结果,而森林最终集成所有决策树的规则和分类结果,实现随机森林算法的分类。其主要特点在于数据采样随机、特征选取随机。2模型数据制备 2.1数据来源及用途将镇域孕灾因子数据赋予评价单元作为随机森林分类模型的样本数据,其中孕灾因子为模型特征因子,区域滑坡环境特征因子数据源主要包括遥感影像数据、表面数字高程模型、地质图、野外调查数据等,其分类及用途见表 2。
18、表 1 研究区滑坡规模分类Tab.1Classification of landslide scale in study area滑坡类型个数规 模比例(%)大型(处)比例(%)中型(处)比例(%)小型(处)比例(%)堆积层滑坡260013.572589.2992.86基岩滑坡2000027.147.14合 计280013.572796.43100.00 研究区N高程(m)高:5 3140200 km低:28水系山脉秦巴山脉其他城市图1研究区位置图Fig.1Location of the study area第 1 期李泽芝等:镇域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能对比研究3 表
19、2 数据类型及用途Tab.2Data types and uses数据类型比例尺/分辨率数据用途DEM5 m提取坡度、坡向、剖面曲率、河流水系等因子;提取评价单元。地质图150 000提取断裂等因子 2.2评价单元栅格单元:研究区栅格共计 4 576 590 个栅格;提取出滑坡周界内所占栅格,共计 6 192 个栅格单元(图 3)。斜坡单元:对研究区 DEM 用水文分析模型进行斜坡单元初步划分,再结合研究区卫星影像图与10 m 等高线进行人工校正(谷天峰等,2013;刘彬等,2021),最终将研究区划分为 729 个斜坡单元(图 4),单个面积概况见表 3,对其中滑坡所在斜坡单元进行标记,共计
20、 28 个斜坡单元。2.3特征因子滑坡的发生是一个由多种因素作用下产生的非常复杂的非线性过程,要通过机器学习模型对全区发生滑坡的概率进行分级,特征因子的选取至关重要(Ahmed et al.,2016;吴润泽等,2021),当根据研究区滑坡的孕灾特点,有针对性的选取。在前人研究基础上,结合区域孕灾特征,初步选 9 个孕灾因子作为模型特征因子用于建模,并依据特征属性,将特征因子进行离散化后做出属性空间划分(图 5),具体如下:地形因子:坡度、坡高。N(a)滑坡点采矿用地道路断裂河谷低山中山010 km(c)(b)a.研究区现有堆积层滑坡分布;b.岭丰村矿洞洞口堆积层滑坡;c.罗庄三组堆积层滑坡图
21、2研究区已有堆积层滑坡分布图Fig.2The distribution of alluvial landslide in the study area N滑坡栅格高程(m)高:2 037.6304 km低:702.059图3研究区栅格单元划分Fig.3Grid division of Study Area4西北地质NORTHWESTERN GEOLOGY2024 年滑坡的主要动力来源于自重,坡度则控制着斜坡内部的应力分布,是滑坡的重要影响因素。将研究区斜坡坡度划分为:015、1525、2535、3545和45等 5 个属性空间。在岩土类型大致相似的地质环境下,坡体高度影响着坡体自重大小以及斜坡
22、范围内地形变化,进而影响滑坡的规模与范围(郭芳芳等,2008)。先将 DEM重采样为 5 m5 m 栅格,再利用分区统计工具得到坡体高度范围,将其分为 020 m、2050 m、50100 m、100300 m、300 m 等 5 个属性空间。斜坡自身特征:斜坡坡面形态、斜坡结构、斜坡堆积层厚度。斜坡形态以其剖面曲率划分,剖面曲率定义为曲面在最陡斜坡方向上的曲率,当曲率值0.5 时值判断为凹型坡,曲率值0.5 时判断为凸型坡,曲率值在0.50.5 之间时判断为直线型坡。据前人研究,斜坡结构在堆积层滑坡的发生中也是一个重要的影响因素(邢林啸等,2012;贾琳等,2021),从研究区已发生的堆积层
23、滑坡来看,39.13%都发生在顺向斜坡中,而逆向斜坡中无已发生滑坡,故根据野外调查数据,将区内斜坡结构划分为:顺向斜坡、斜向斜坡、横向斜坡、近水平状斜坡、切向斜坡、逆向斜坡等 6 个属性空间。由于区内滑坡大都为堆积层滑坡,堆积层厚度在一定程度上决定了土地利用类型、边坡开挖程度、地下水位埋深,对堆积层滑坡起着重要启发作用,但对于这一指标,目前缺乏经济又精准的测取方法,本研究方法如下:对每个坡体随机抽点使用插杆进行测量得到平均数,结合依托项目的工程钻探数据对调查结果进行修正并类比到全区,赋值给每个斜坡,将该因子划分为:01 m、13 m、36 m、610 m、10 m等 5 个属性空间。人类工程相
24、关特征:距道路距离、距河流距离、距矿区距离。区内平缓地带稀少,道路开通处往往伴随着边坡开挖,形成陡立临空面;河流对坡脚的侵蚀、依河而居带来的切坡建房;矿山的开挖、震爆、不合理的矿渣堆积,这些因素都为滑坡的发生提供了有利条件。距河流、道路、矿区的距离均可反应人类工程活动的强弱程度,其各自属性区间划分如图 5 所示。地质条件:距断裂距离。区内受山阳凤镇等深大断裂影响较大,该断裂呈近东西展布,经凤镇横贯研究区,该断裂对区内表层岩体破坏严重,加之研究区内节理裂隙极为发育,极大地破坏了岩土体的完整性,增加了滑坡的发生概率。对研究区地质图进行矢量化,提取研究区内断裂为矢量文件,对其做缓冲分析,划分为 01
25、00 m、100400 m、400700 m、7001000 m、1000 m 等5 个属性区。将上述特征因子赋值给两种划分单元:栅格单元:在 Arcgis10.7 中,将栅格转化为点数据,用“多值提取至点”工具将各因子值提取至点,与初步选取的 9 个因子构成矩阵 A4 576 5909,作为原始样本 1。斜坡单元:除斜坡结构等因子在每个斜坡单元有唯一值外,对于坡面形态等离散型变量,取其众数赋值;对于坡度等连续型变量,取其平均数赋值,729 个斜坡单元与初步选取的 9 个因子构成矩阵 B7299,作为原始样本 2。对两种划分单元下的原始样本分别进行频率比分析,得到各因子属性区间的频率比值。频率
26、比值的大小可反应该属性空间滑坡发育的优势程度(郭子正等,2019),若某属性空间评价单元样本数过少(如斜 表 3 斜坡单元面积概况Tab.3Overview of slope unit area斜坡单元面积类型最大面积(km2)最小面积(km2)平均面积(km2)面积值0.810.0190.14 N斜坡单元滑坡所在坡单元高程(m)高:2 037.6304 km低:702.059图4研究区斜坡单元划分Fig.4Slope division of study area第 1 期李泽芝等:镇域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能对比研究5 坡单元中近水平斜坡数量),则在选择优势空间时,剔除
27、该属性空间,最终统计得各因子的滑坡发育优势空间(表 4)。随机森林模型对特征因子的相关性有一定要求,(a)N坡度()0151525253535454504 km(d)N堆积层厚度(m)斜坡单元0113366101004 km(g)N距断裂距离(m)01001004004007007001 0001 00004 km(h)N距道路距离(m)100300010030050050070070090090004 km(i)N距矿区距离(m)100300010030050050070070090090004 km(f)N距河流距离(m)01001004005007007001 0001 00004 km
28、(e)N坡面形态凹型坡直线型坡凸型坡04 km(b)N坡高(m)斜坡单元02020505010010030030004 km(c)N斜坡结构斜坡单元顺向斜坡逆向斜坡近水平状斜坡横向斜坡斜向斜坡切向斜坡04 kma.坡度;b.坡体高度;c.斜坡结构;d.堆积层厚度;e.斜坡形态;f.距河流距离;g.距断裂距离;h.距道路距离;i.距矿区距离图5研究区滑坡地质灾害易发性评价指标因子Fig.5Index factors of landslide geological hazard Susceptibility assessment in the study area6西北地质NORTHWESTERN
29、 GEOLOGY2024 年因子之间相关性过高会降低模型的训练精度。对研究区特征因子首先进行正态性检验,以确定相关性分析的计算方式。若数据满足正态分布,则选用 Pearson相关性分析;若数据不满足正态分布,则用 Speraman相关性分析;针对有序变量数据,则选用 Kendallstau-b 等级进行相关性分析。由表 5 可知,两种评价单元下各因子显著性 P 值均为 0.000*,水平呈现显著性,拒绝原假设,因此数据不满足正态分布。由于数据为有序数据,选用Kendalls tau-b 等级进行相关性分析(表 6、表 7)。由结果可知,栅格单元下,研究区距河流距离与距道路距离特征因子的相关性系
30、数为 0.6530.3;斜坡单元下,研究区距河流距离与距道路距离特征因子的相关性系数为 0.6060.3,说明两种评价单元下道路与河 表 4 两种评价单元下各因子的滑坡发育优势空间Tab.4Dominant space of landslide development of each factor under two evaluation units特征因子坡度()坡高(m)堆积层厚度(m)坡面形态斜坡结构距河流距离(m)距道路距离(m)距矿区距离(m)距断裂距离(m)栅格单元253510030013凹型坡顺向斜坡10040001005007001 000斜坡单元253510030013凹型坡
31、顺向斜坡10040001001 0001 000 表 5 特征因子数据正态性检验结果Tab.5Characteristic factor data Normality test results特征因子K-S检验(栅格单元)S-W检验(斜坡单元)坡高(m)0.33(0.000*)0.762(0.000*)距河流距离(m)0.343(0.000*)0.843(0.000*)距道路距离(m)0.210(0.000*)0.866(0.000*)距矿区距离(m)0.361(0.000*)0.869(0.000*)堆积层厚度(m)0.268(0.000*)0.841(0.000*)坡度()0.293(0.
32、000*)0.719(0.000*)坡面形态0.355(0.000*)0.794(0.000*)斜坡结构0.439(0.000*)0.849(0.000*)距断裂距离(m)0.208(0.000*)0.852(0.000*)注:*、*、*分别代表1%、5%、10%的显著性水平。表 6 特征因子 Kendalls tau-b 等级相关系数矩阵(栅格单元)Tab.6Characteristic factor Kendalls tau-b rank correlation coefficient matrix(grid units)距矿区距离(m)距道路距离(m)坡面类型坡度()距断裂距离(m)斜坡
33、结构坡高(m)堆积层厚度(m)距河流距离(m)距矿区距离(m)1距道路距离(m)0.3041坡面类型0.0130.0241坡度()0.010.0870.0231距断裂距离(m)0.0010.1180.0050.021斜坡结构0.1410.0570.0060.0040.2011坡高(m)0.2140.2030.0090.060.0020.0031堆积层厚度(m)0.0530.0430.0030.0280.0020.090.0241距河流距离(m)0.0990.6530.0290.0730.1210.0230.1250.0031第 1 期李泽芝等:镇域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能
34、对比研究7 流之间的相关性都较高。由于研究区堆积层滑坡主要分布在道路两侧,故剔除河流距离因子,最终采用其他剩余 8 个因子进行建模评价。3评价及结果对比分析 3.1评价结果对于栅格单元,将 4 576 590 个栅格单元转化为连接有各因子数据的点后,将 6 192 个滑坡栅格点作为滑坡样本并将其易发性赋值为 1,占总样本的 0.13%,在滑坡范围外选取 3 倍于滑坡样本的点作为非滑坡样本,以减少滑坡与非滑坡样本之间的数量不平衡与空间相关性,并将其易发性赋值为 0,两类数据合并后以 73 的比例划分为训练集与测试集,在 R 语言的RF 软件包中构建随机森林模型,将合并后数据输入进行训练。训练结束
35、后,将整个研究区点数据输入,得到所有点的易发性值。将点数据转为栅格,利用自然间断法划分出极低、低、中、高、极高等 5 个易发区(图 6)。对于斜坡单元,选取 28 个滑坡所在的斜坡单元作为滑坡样本并将其易发性赋值为 1,占总样本的 表 7 特征因子 Kendalls tau-b 等级相关系数矩阵(斜坡单元)Tab.7Characteristic factor Kendalls tau-brank correlation coefficient matrix(slope units)距矿区距离(m)距道路距离(m)坡面类型坡度()距断裂距离(m)斜坡结构坡高(m)堆积层厚度(m)距河流距离(m)
36、距矿区距离(m)1距道路距离(m)0.2461坡面类型0.0590.1241坡度()0.070.0340.0461距断裂距离(m)0.0060.1860.0420.0181斜坡结构0.1120.060.0320.0830.1991坡高(m)0.1620.2020.0430.1540.0110.0011堆积层厚度(m)0.0390.050.0430.0850.0020.0930.0681距河流距离(m)0.020.6060.1220.0040.1380.0110.1250.0021(a)栅格单元滑坡区栅格易发性分区05 km极低易发低易发中易发高易发极高易发N(b)斜坡单元斜坡单元滑坡点易发性分
37、区05 km极低易发低易发中易发高易发极高易发Na.栅格单元下研究区滑坡易发性区划图;b.斜坡单元下研究区滑坡易发性区划图图6研究区滑坡易发性区划Fig.6The division of landslide susceptibility in the study area8西北地质NORTHWESTERN GEOLOGY2024 年3.8%,在滑坡范围外选取 3 倍于滑坡样本的点作为非滑坡样本,并将其易发性赋值为 0。剩余操作与栅格单元类似,结果见图 6。由图 6、表 8 可知:两种评价单元下滑坡易发性分区大体相近,滑坡高、极高易发区主要位于镇域北部矿区附近、西北部道路切坡密集区域、西南部盘山
38、公路切坡密集道路附近,表明研究区内滑坡的发育与道路、矿区的影响有较强的相关性,这也与实际情况相符合。栅格单元下预测的极低、低、中、高和极高易发区占研究区全区比例为:66.76%、19.50%、8.99%、3.04%和 1.71%,已知滑坡样本在高、极高易发样本量中占 95.49%;斜坡单元下预测的极低、低、中、高、极高易发区占研究区全区比例分别为 61.92%、17.70%、10.09%、5.25%和 5.04%,已知滑坡样本在高、极高易发样本量中占 96.42%。栅格单元下高、极高易发区频率比之和占总频率比值为 0.93,略低于斜坡单元下比值 0.98,可知斜坡单元下的滑坡易发性可更好的判断
39、已知滑坡,且斜坡单元下的评价可很好的表现滑坡的地形分布特点。表 8 栅格单元与斜坡单元下评价结果频率比Tab.8Frequency ratio of evaluation resultsunder grid unit and slope unit评价单元易发性滑坡单元数(个)滑坡单元比例(%)全区单元(个)全区单元比例(%)频率比栅格单元极低00.003 055 33166.760.00低270.44892 43519.500.02中2524.07411 4358.990.45高6039.73139 1293.043.20极高5 31085.7678 2601.7150.15斜坡单元极低00.
40、0045135.670.00低00.0012928.530中13.577918.380.19高13.573812.620.28极高2692.86324.8019.35 由模型得到两种评价单元下各特征因子的重要性比例(图 7),可知道路开挖、斜坡结构对滑坡的发生起主要作用,事实上,现有滑坡多发生在道路两旁及顺向结构斜坡中。3.2模型精度及评价结果对比结合前人研究(刘坚等,2018;郑迎凯等,2020),笔者选取 ROC 曲线来进行模型精度验证。将全部样本滑坡易发性概率递减排序,阈值从 1 至 0 变更,计算各阈值下对应的(FPR、TPR)数值对,将数值对绘制于直角坐标系中。横坐标 FPR 代表非
41、滑坡预测为滑坡的数量/真实非滑坡数量;纵坐标 TPR 代表滑坡预测为滑坡的数量/真实滑坡数量。曲线下面积(AUC)越接近 1,则说明模型预测性能越高。根据两种评价单元下预测结果,绘制各自 ROC 曲线(图 8),可以看出,基于栅格单元、斜坡单元下随机森林模型的 AUC值分别为 0.864、0.921。表明 5 m 高精度栅格单元下随机森林模型的预测精度小于基于斜坡单元下模型的预测精度。假阳性率(FPR)斜坡单元 AUC=0.921栅格单元 AUC=0.864AUC=0.5真阳性率(TPR)000.20.40.60.81.00.20.40.60.81.0图8ROC 曲线Fig.8ROC curv
42、e 滑坡的发生相对于整个区域是一个小概率事件,整个区域内滑坡易发性概率在预测模型精度较高的情况下,均值越低,表明预测的不确定性越低;标准差越低,表明预测区分度更优,由表 9 可知,栅格单元下预测滑坡易发性概率均值为 0.10 小于斜坡单元下滑坡易发性概率均值 0.13;栅格单元下预测滑坡易发性概率标准差为 0.13,小于坡单元下滑坡易发性概率标 距矿区距离302520151050堆积层厚度坡面类型斜坡结构坡高坡度距断裂距离距道路距离斜坡单元栅格单元图7各特征因子贡献值Fig.7Contribution value of each characteristic factor第 1 期李泽芝等:镇
43、域尺度下秦巴山区堆积层滑坡易发性不同单元评价性能对比研究9 准差 0.18。说明栅格单元作为评价单元,预测结果具有较差的区分度,斜坡单元反之。表 9 不同评价单元下易发性概率均值与标准差Tab.9Mean and standard deviation of probability ofSusceptibility under different evaluation units评价单元均值标准差栅格单元0.100.13斜坡单元0.130.18 4结论(1)结合研究区孕灾特征,选取了坡度、坡高、坡面形态、斜坡结构类型、堆积层厚度、道路、矿区、区域地质断裂等 8 个孕灾因子作为模型特征因子,栅格单
44、元、斜坡单元两种评价单元的预测结果,均发现模型主要根据道路、斜坡结构等因素区分滑坡、非滑坡区域。据各因子频率比值可知,研究区内,在距道路100 m 内的顺向浅层堆积层斜坡中,最易发生滑坡。(2)在栅格单元、斜坡单元两种评价单元下,研究区 95.49%、96.42%的滑坡落在随机森林模型预测分区出的高、极高易发区内;通过 AUC 值、易发性概率均值、易发性概率标准差对比表明:随机森林是一种可靠、全面的滑坡易发性预测模型,评价单元为斜坡单元时预测精度更高、准确性更强。(3)滑坡易发性评价中,栅格单元与斜坡单元在评价结果上,两种评价单元的预测结果都有良好的表现。栅格单元的样本数远高于斜坡单元,意味着
45、样本数据中滑坡样本比例减小,样本的不均衡性增大,使得随机森林模型的预测结果性能变弱,但以栅格单元为评价单元可减少特征因子的数据损失,在灾害防治具体空间部署上有着更精细的参考;斜坡单元在特征因子赋值时,会造成部分数据损失,但其能更好体现滑坡灾害的地形空间属性,相较于栅格单元其样本的不均衡性更小,使得其基于随机森林模型的预测性能高于栅格单元。参考文献(References):常志璐,黄发明,蒋水华,等.基于多尺度分割方法的斜坡单元划分及滑坡易发性预测J.工程科学与技术,2023,55(1):184195.CHANG Zhilu,HUANG Faming,JIANG Shuihua,et al.Sl
46、ope UnitExtraction and Landslide Susceptibility Prediction Using Multi-scale Segmentation MethodJ.Advanced Engineering Sci-ences,2023,55(1):184195.方匡南,吴见彬,朱建平,等.随机森林方法研究综述J.统计与信息论坛,2011,26(03):3238.FANG Kuangnan,WU Jianbin,ZHU Jianping,et al.Review of ran-dom forest methodsJ.Statistics and Informati
47、on Forum,2011,26(03):3238.范立民,何进军,李存购.秦巴山区滑坡发育规律研究J.中国地质灾害与防治学报,2004,15(01):4751.FAN Limin,HE Jinjun,LI Cungou.Study on the development law oflandslides in Qinba MountainsJ.Chinese Journal of Geologic-al Hazards and Prevention,2004,15(01):4751.郭芳芳,杨农,孟晖,等.地形起伏度和坡度分析在区域滑坡灾害评价中的应用J.中国地质,2008,35(1):131
48、143.郭子正,殷坤龙,黄发明,等.基于滑坡分类和加权频率比模型的滑坡易发性评价J.岩石力学与工程学报,2019,38(02):287300.GUO Zizheng,YIN Kunlong,HUANG Faming,et al.Landslide sus-ceptibility evaluation based on landslide classification andweighted frequency ratio modelJ.Chinese Journal of RockMechanics and Engineering,2019,38(02):287300.黄发明,胡松雁,闫学涯,
49、等.基于机器学习的滑坡易发性预测建模及其主控因子识别J.地质科技通报,2022,41(02):7990.HUANG Fangming,HU Songyan,YAN Xueya,et al.Landslide sus-ceptibility prediction modeling and main control factor identific-ation based on machine learningJ.Bulletin of Geological Sci-ence and Technology,2022,41(02):7990.黄润秋.20 世纪以来中国的大型滑坡及其发生机制J.岩石力
50、学与工程学报,2007,26(3):433454.HUANG Runqiu.Large-scale landslides and their mechanism inChina since the 20th centuryJ.Journal of Rock Mechanicsand Engineering,2007,26(3):433454.贾琳,蔡静森,晏鄂川,等.基于地质环境分区的南漳县城区滑坡易发性评价J.人民长江,2021,52(05):8694.JIA Lin,CAI Jingsen,YAN Echuan,et al.Evaluation of landslidesusceptibi