1、防灾减灾学报JOURNAL OF DISASTER PREVENTION AND REDUCTION第39卷第2期2023年6月Vol.39 No.2Jun.,2023文章编号:1674-8565(2023)02-0076-05张欣然,李雨佳,孙艺,孔祥雪,田雨佳(辽宁省地震局,辽宁沈阳110034)摘要:针对以街道、乡镇级别行政区划为统计单元的人口数据,无法满足地震处置及相关科研工作的需求等问题,提出一种基于地理信息系统技术的统计学模型设想。融合多源数据,运用因子分析法,与人口统计数据进行空间匹配解算获得人口公里网格数据,将人口数据精度从乡镇级别提高至公里级别。拟融合的多源数据包括地理国情地
2、表覆盖类房屋建筑数据、灯光遥感影像数据、道路分布数据、兴趣点数据、数字高程数据等。通过与单一数据模拟方法对比分析,获得高精度人口数据,从而达到提升地震灾害风险评估能力的目的。关键词:公里网格;人口分布;房屋建筑;多源数据;地理信息系统技术中图分类号:P315;P208文献标志码:ADOI:10.13693/21-1573.2023.02.012基金项目:中国地震局监测预报司地震应急青年重点项目:沈阳市人口分布估算方法研究(CEAEDEM202105);辽宁省地震局青年科研基金项目:地震应急灾害损失快速评估结果优化及专家辅助决策一张表(LZ2022017)收稿日期:2022-06-28修订日期:
3、2022-12-06编辑:毛佳宁作者简介:张欣然(1989-),女,辽宁省海城市人,本科,工程师,主要从事地震及测绘研究。E-mail:多源数据人口分布模拟方法研究设想0引言破坏性地震造成的建筑物及构筑物倒塌是造成人员伤亡及财产损失的主要因素。地震灾害后人员伤亡数量的评估,需要人口数据的支持,人口数据对地震灾害损失震前预评估及震后快速评估都至关重要。人口普查是目前在国际上获得广泛共识的用于获取人口信息的科学方法,抽样比例可达1%,其最高行政统计精度可达到乡镇级别。使用人口普查成果数据进行地震灾害损失评估计算存在两个问题:第一,人口普查工作由国家统一调度开展,更新频率为每十年一次,由于数量庞大,
4、从数据统计、整理到公开发布时间较长;第二,人口普查数据以乡镇级别为最小单元进行统计,不能反映人口在乡镇内的聚集情况,无法分辨出人口空间分布的差异性。所以制作人口公里网格数据,可用于地震灾害损失评估的计算,在地震灾害预警、应急决策产出、提高城市韧性等诸多领域具有较好的应用前景。1更新人口数据意义2001 年 11 月 14 日昆仑山口发生 8.1 级地震,地震最高烈度为 XI 度,最长破裂长度为426 km,因发生在无人区所以房屋倒塌统计结果为0,人员伤亡也为0。对比2008年5月12日汶川 8.0 级地震,地震最高烈度同样为 XI 度,最长破裂长度为225 km,但造成人数为69 227人死亡
5、,17 923 人失踪,房屋倒塌 779 万间,房屋损坏2 450万间。破坏性地震造成的人员伤亡及财产损失程度不同,在灾害信息无法获取时,给出更接近实际情况的灾区可能遇险人数,2期是地震灾害损失评估工作的科研目标。在进行地震灾害损失评估时,无论是震前预评估还是震后快速评估,人口数据都是计算地震灾害损失情况的核心数据,更新人口数据可以提高地震应急指挥决策能力。辽宁省地震局地震应急相关响应及运维等核心业务工作也依托地震应急基础数据开展,评估基于房屋建筑物破坏情况导致的人口及经济损失程度是灾害评价的重要指标。2人口数据空间模拟方法分析近年来,基于多源数据和地理信息系统的人口数据空间化方法,成为人口数
6、据模拟分布研究的主要手段之一。运用地理信息系统分析方法及统计学手段评估计算,得出人口数据在一定时空和地理要素下的模拟分布情况。人口普查数据通过空间化处理,可使用单一数据源进行人口分布模拟研究,也可使用多数据源融合的方式进行研究,数据源包含地表覆盖类数据、建构筑物分布数据、道路路网通达性数据、社会经济发展指标类数据及卫星遥感数据等。2.1 基于建筑物或地表覆盖数据建立人口分布模拟数据人口与建筑物的空间分布情况有明显的关联性。按照全国第一次地理国情普查项目辽宁省内数据成果和字典的描述,普查对象为辽宁省范围内自然地理要素及人文地理要素,其中包括居民地与设施等。地理国情普查采集完整地表覆盖数据类,包括
7、耕地、园地、林地、草地、房屋建筑(区)、道路、构筑物、人工堆掘地、荒漠与裸露地表、水域等10种类型。不考虑人口在水域、荒漠与裸露地等不适宜人类居住地点生存的极个别情况,人口应分布在居民地房屋建筑区内。汇总各街道及乡镇内建筑物面积,统计分析建筑物面积与人口数量的函数关系,实现人口数据网格化。既往研究中,也有选取与人口相关性较高的土地利用数据,例如建筑物用地类、农耕用地类、牧场草地类等可能进行生活生产的实际土地利用类型,研究各类用地面积与区域内人口分布情况的对应关系,数据需通过一致性检验,即证明数据间关联性后,可以进行空间匹配。常用的方法有分区域建模、分城乡建模等,但这种细化的分级建模模式存在参数
8、较多、过程复杂、难以大范围推广、未考虑人口分布的随机性等问题1-2。2.2 基于道路交通数据建立人口分布模拟数据交通道路是人类活动的主要通行道路之一,交通道路的规划建设与人类社会的发展有着紧密的联系,通过统计局公布的人均城市道路面积数据,可发现该数据与当地的经济水平及人口数量存在关联性,道路缓冲区内对人口分布具有一定的聚集效果。也可通过地理国情普查数据中道路路网数据,计算道路面积与当地人口数量的关系,进行人口统计分布模拟计算3-4。在已开展的分析研究中,证实了道路发展与人口发展是存在着相互促进作用的,主要通过对道路数据建立缓冲区,构建不同权值的数学模型来实现人口数据空间分布的数字表达。交通道路
9、缓冲区面积与人口数量关联度有限,研究拟提出以道路交叉点为主要研究对象,引入地理信息系统核密度计算方法,对道路交叉点进行核密度分析,分析计算对应人口数据的空间分布情况。2.3 基于卫星影像数据建立人口分布模拟数据夜间灯光数据可以作为人类活动宏观表征有力依据,在社会经济估算、城市检测、危机评估及环境监测等领域均存在重要的研究价值。夜间灯光遥感影像数据可以公开获取,在探索基于夜间灯光数据模拟人居分布的模型关系上,主要的特征值为灯光强度值及对应灯光面积值,研究的成果精度较高,多用于宏观人口分布情况的估计5-9。该方法的优势在于夜间灯光数据更新速度快、可操作性较强且获取方式便捷。但夜间灯光遥感数据适用于
10、发达地区人口分析模拟计算,对于欠发达区域夜间灯光较弱问题不能解决,依靠单一夜间灯光数据进行大范围高精度的人口模拟分析,可能造成精度较低且误差较大的问题。2.4 基于网络大数据建立人口分布模拟数据第 49 次 中国互联网络发展状况统计报张欣然,等:多源数据人口分布模拟方法研究设想77防灾减灾学报39卷告 显示,截至 2021年 12月我国网民规模达10.32亿,较2020年12月增长4296万,互联网普及率达73.0%。网络大数据具有信息全、时效强、应用广等特点。目前运用在人口模拟统计分析研究的网络信息有位置大数据、微博签到数据、兴趣点数据、出行类App数据等10-12。综合考虑数据的获取难度、
11、受众人群、更新时效及数据冗余量等方面问题,拟选取POI数据作为人口分布模拟研究基础数据。POI数据,又称为兴趣点数据,根据不同的关注对象提取不同类别的兴趣点数据。随着互联网行业的普及与发展,POI数据作为新兴数据类型应用越来越广泛。POI数据主要分布在城市地区,可以进行城市地区人口分布模拟估算,通过四叉树索引、标准差椭圆、平均最近邻或核密度的方法分析研究区域的空间人口分布特征,建立人口估算模型。2.5 基于地形数据建立人口分布模拟数据地表形态数据主要体现为海拔和地势,地表形态有平原、高原、山地、丘陵、盆地、裂谷、岩溶等。地表形态对人类的活动影响深远。从农业角度来说,平原适合种植业,山区适合林牧
12、业,河流湖泊适合渔业;从工业角度来说,地表形态决定了用地面积及成本;从城市或乡村规模来说,平原地区城市或乡村特点为规模大且呈团状集中分布,道路密度大,山地地区城市或乡村特点为规模小且呈条带状分散分布,道路密度小。地表形态对建筑物分布及人口分布情况有影响作用13。平原地区人口密度大,高原及山地地区人口密度小。在不同地表形态影响下,城市或乡村的分布特点不同,平原地区人口分布聚集性强,可使用距离衰减模型计算,山地地区人口分布在较平坦的低地势区域,与地表形态密切相关,可根据地表形态建立模型计算。2.6 基于多源数据融合建立人口分布模拟数据多源数据融合模拟分析方法较单一数据源模拟方法获取的人口数据精度更
13、高,更适合进行公里级别的人口分布模拟分析,具有重要的研究意义和科学价值。既往的研究中有融合土地利用数据、地表覆盖类数据、地表透水率及夜间灯光影像数据等进行联合分析模拟人口分布情况14。当使用单一数据源进行人口分布情况模拟研究时,受制约单一因素的数据影响较大,比如交通路线的建设受环境条件的制约,夜间灯光强弱分布受云层状态的影响等,故产出的成果数据误差较大。3研究设想假设多源数据为影响人口分布情况的因子,通过主观层次分析法或客观主成分分析法及因子分析法选取影响人口分布情况的指示性基础要素,数据经过归一化及标准化处理后,确定各类要素权重值,使用地理信息系统处理方法统一多要素模型进行解算15-19。多
14、数据融合的空间分析模型在人口分布模拟研究计算中应用最为广泛,且参与计算的指示性因子越客观,模型受干扰因素越少。该方法缺点在于对参与计算的基础数据要求较高,需通过数据相关性校验才能进行统计分析计算。研究拟建立人口公里网格数据。研究区域选取辽宁省,基础数据为第七次全国人口普查乡镇级成果数据、第一次地理国情普查建筑物数据、道路路网数据、NPP/VIIRS夜间灯光影像数据、兴趣点大数据、地表数字高程数据(DEM)等多源数据,使用统计分析中因子分析方法进行权重分析叠加,对成果数据进行实地抽样调查,检验数据精度。3.1 人口模拟计算方法对第七次全国人口普查乡镇级成果数据进行空间化处理。以建筑物数据为基础,
15、分区域对建筑物进行分类并加权整理叠加,模拟居民地数据的静态分布情况。将地形数据、道路路网分布数据、兴趣点数据、夜间灯光影像数据及建筑物数据与人口数据进行相关性分析及因子分析,计算各公里网格内的权重系数,得到人口公里网格数据,如图1所示。需要对各类参与统计分析的基础数据进行预先处理,对高程数据进行坡度标准差分析,对建筑物数据进行加权分析,对道路数据进行线密度分析,对兴趣点数据进行泰森多边形核密度分析。782期张欣然,等:多源数据人口分布模拟方法研究设想图1 技术流程图Fig.1 Technical flow chart3.2 多源数据权重统计分析研究拟使用SPSS软件进行建模分析,采用主成分分析
16、法(PCA),计算各因子的贡献度。统计分析流程思路为:首先,进行多维度偏好分析(MPA),采取最优尺度降维处理,确定因子取值方式;其次,对数据进行标准化处理,排除共线性关系,再进行效度检验,以及因子维度探索性划分,确定主成分数量;再次进行因子分析及提取,给出成分矩阵载荷因子分析模型,得到主成分分析法因子得分函数,并对因子进行命名;最后,计算因子在各级指标上的权重。3.3 人口数据模拟成果精度检验由于研究拟使用乡镇级第七次全国人口普查数据作为基础数据进行解算,无法使用乡镇级别人口统计数据进行误差分析。所以对研究成果数据精度进行检验时,需要对单一公里网格内人口数量进行抽样调查。抽样点的选取采用客观
17、随机抽样的方式,按照固定的行列矩阵间隔进行选取。研究区域内选取的调查点间隔为10公里,对每个调查点的人口数量进行实地调研,调查结果与研究成果进行对比及误差分析,从而验证模型效果。4应用预期人口普查由政府组织,每十年进行一次,虽能够提供完整且准确的人口统计信息,但更新频率太低,不能满足每年更新地震应急基础数据库的需求。基于多源数据的人口分布模拟研究成果可以作为未开展人口普查年的数据更新依据。人口基础数据对各行业部门发展及研究具有重要意义。人口基础数据来源较为广泛,数据的侧重性不同,本研究拟建立适用于地震研究的人口基础数据。基于多源数据进行联合分析方法,为高精度人口空间分布模拟研究提供了技术支持,
18、借助地理信息系统手段对多源数据进行汇总统计,提高成果数据的准确性。数据成果可应用于地震应急损失评估与救援及地震灾害防御等多领域,从而提高地震应急处置能力。参考文献:1孟瑶,李锐,蒋捷,等.基于建筑物信息的城市街道尺度人口估算 J.武汉大学学报(信息科学版),2021,46(8):1194-1200.2赵真,郭红梅,张莹,等.基于天地图高精度建筑物的四川宝兴县人口估算 J.地震研究,2019,42(2):204-209+305.3李海蓉,阚瑷珂.攀枝花市人口分布与道路设施布局空间自相关研究 J.科学技术与工程,2014,14(20):281-285+312.4黎云路,王超.城市规划和人口密度:城
19、市交通发展影响因素研究以新疆乌鲁木齐市为例 J.新疆社会科学,2013(3):42-46.5郭山山,龚俊,尹晶飞.基于DMSP/OLS的人口分布网格精细化研究 J.地震研究,2016,39(2):321-326+176.6张秋媛,彭明春,王崇云,等.基于DMSP/OLS夜间灯光数据的贵州省人口分布及影响因子分析J.云南大学学报(自然科学版),2019,41(5):992-1000.7李欣欣,王利,何飞.基于NPP/VIIRS夜间灯光数据和土地利用数据的人口分布图绘制以大连金普新区为例 J.遥感信息,2018,33(4):35-41.8肖东升,杨松.基于夜间灯光数据的人口空间分布研究综述 J.国
20、土资源遥感,2019,31(3):10-19.9刘艳姣,王介勇,王志炜.基于NPP/VIIRS夜间灯光数据的黄淮海地区城乡常住人口格局模拟 J.地域研究与开发,2019,38(3):176-180.10 关文川,吴志峰,吴卓,等.基于微信宜出行数据的城市人口活动时空探测及其影响因素分析J.现代城市研究,2021(8):2-9.11 王贤文,王虹茵,李清纯.基于地理位置大数据79防灾减灾学报39卷的京津冀城市群短期人口流动研究J.大连理工大学学报(社会科学版),2017,38(2):105-113.12 吴中元,许捍卫,胡钟敏.基于腾讯位置大数据的精细尺度人口空间化以南京市江宁区秣陵街道为例 J
21、.地理与地理信息科学,2019,35(6):61-65.13 曹彦波,李永强,李敏,等.基于多源数据的云南人口空间分布模拟研究 J.中国地震,2014,30(1):118-131.14 李爽,赵翠薇.基于土地利用和DMSP/OLS夜间灯光数据的河南省人口空间化研究 J.湖南师范大学自然科学学报,2019,42(2):9-15.15 王娇娇,李中元.基于Landsat OLI影像及NPP-VIIRS灯光数据的武汉市人口密度估算 J.地域研究与开发,2019,38(6):146-151.16 赵鑫,宋英强,刘轶伦,等.基于卫星遥感和POI数据的人口空间化研究以广州市为例 J.热带地理,2020,4
22、0(1):101-109.17 淳锦,张新长,黄健锋,等.基于POI数据的人口分布格网化方法研究 J.地理与地理信息科学,2018,34(4):83-89+124+2.18 梁友嘉,徐中民.基于LUCC和夜间灯光辐射数据的张掖市甘州区人口空间分布建模 J.冰川冻土,2012,34(4):999-1006.19 董春,尹诗画,张玉.多智能体的城市精细尺度人口估算模型 J.测绘科学,2019,44(8):113-119.Research Conception of High Resolution Population DistributionSimulation MethodZHANG Xin-r
23、an,LI Yu-jia,SUN Yi,KONG Xiang-xue,TIAN Yu-jia(Liaoning Earthquake Agency,Liaoning Shenyang 110034,China)Abstract:In view of the fact that the population data based on the administrative divisions at the street andtownship levels can not meet the needs of earthquake treatment and related scientific
24、research,a statisticalmodel based on GIS technology is proposed.Integrating multi-source data and using factor analysis method,the population kilometer grid data is obtained by spatial matching with demographic data,which improvesthe accuracy of population data from township level to kilometer level
25、.The multi-source data to be fused include the building data of the ground cover type buildings,the lighting remote sensing image data,the roaddistribution data,the point of interest data,the digital elevation data,etc.,which are compared and analyzed with the single data simulation method.Obtaining
26、 high-precision population data can improve the ability of earthquake disaster risk assessment.Key words:kilometre grid;population distribution;housing construction;multi-source data;geographic information system technology序号1234发震时间月1111日7111330时 分 秒00:27:0011:34:2018:37:2223:41:51地震位置N/()40.03848.32442.73350.995E/()122.736130.429123.044124.597地点辽宁庄河黑龙江嘉荫辽宁康平(矿震)黑龙江大兴安岭震级/(ML)3.13.73.23.8深度/(km)121008精度1121东北地区2023年第一季度ML3.0地震目录The earthquakes(ML3.0)catalogue of the First Quarter in northeastern area,2023.(注:吉林省与黑龙江省地震目录摘自全国统一编目系统)王承伟供稿80