收藏 分销(赏)

2021粤港澳大湾区政府数据开放报告.pdf

上传人:宇*** 文档编号:3935225 上传时间:2024-07-24 格式:PDF 页数:45 大小:2.84MB
下载 相关 举报
2021粤港澳大湾区政府数据开放报告.pdf_第1页
第1页 / 共45页
2021粤港澳大湾区政府数据开放报告.pdf_第2页
第2页 / 共45页
2021粤港澳大湾区政府数据开放报告.pdf_第3页
第3页 / 共45页
2021粤港澳大湾区政府数据开放报告.pdf_第4页
第4页 / 共45页
2021粤港澳大湾区政府数据开放报告.pdf_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、1001001引言 大湾区数林概貌 大湾区数林指标 大湾区数林指数 大湾区数林标杆 数林建言 评估方法附录 001003005008010035037040001引言粤港澳大湾区包括香港特别行政区、澳门特别行政区和广东省广州市、深圳市、珠海市、佛山市、惠州市、东莞市、中山市、江门市、肇庆市,是我国开放程度最高、经济活力最强的区域之一,在国家发展大局中具有重要战略地位。2019 年 2 月 18 日,中共中央、国务院印发粤港澳大湾区发展规划纲要,明确“粤港澳大湾区不仅要建成充满活力的世界级城市群、国际科技创新中心、一带一路 建设的重要支撑、内地与港澳深度合作示范区,还要打造成宜居宜业宜游的优质生

2、活圈,成为高质量发展的典范。”2020 年 10 月 11 日,中共中央办公厅、国务院办公厅发布深圳建设中国特色社会主义先行示范区综合改革试点实施方案(2020-2025年),提出要“试点推进政府数据开放共享。支持建设粤港澳大湾区数据平台”。2021 年 9 月 22 日,广东省人民政府通过 广东省公共数据管理办法,要求“公共数据应当依法有序开放”。粤港澳大湾区是我国政府数据开放的先行地区,进一步提升粤港澳大湾区的政府数据开放水平,不仅有利于促进数据要素在粤港澳大湾区的流动和利用,还有利于充分发挥粤港澳综合优势,提升粤港澳大湾区在国家经济发展和对外开放中的支撑引领作用。在此背景下,本报告对粤港

3、澳大湾区政府数据开放的现状和水平进行了研究和评价。002粤港澳大湾区政府数据开放报告是“中国开放数林指数”发布的区域性系列报告之一。“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品。“开放数林”意喻我国政府数据开放利用的生态体系,“开放数林指数”自 2017 年 5 月首次发布以来,定期对我国地方政府数据开放水平进行综合评价,精心测量各地“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的培育与发展。开放数据,蔚然成林,粤港澳大湾区的每一棵开放“数木”不仅枝繁叶密、花开结果,更能根系相通、枝叶相连,终将成长为一片茂盛多样,互

4、联互通的粤港澳大湾区“开放数林”。003香港于 2011 年上线了政府数据开放平台“资料一线通”。自 2015 年以来,粤港澳大湾区上线的地方政府数据开放平台数量持续快速增长(如图 1 所示),目前,粤港澳大湾区的两个特别行政区与九个城市都已上线了政府数据开放平台。各地平台上线时间的地理空间分布如图 2 所示,具体上线时间如表 1 所示。一、大湾区数林概貌 图 1 粤港澳大湾区政府数据开放平台数量004 表 1 粤港澳大湾区平台上线时间一览表(按拼音首字母排序)图 2 粤港澳大湾区政府数据开放平台上线时间的空间分布0052.1 评估指标体系粤港澳大湾区政府数据开放报告在“中国开放数林指数”评估

5、指标体系的基础上,立足国家政策方向,根据粤港澳大湾区的区域特点和创新实践,对部分指标进行了调整,如准备度层面增加了“数据集开放计划 指标,数据层增加了对数据描述说明中数据字典指标。最终确定的粤港澳大湾区开放数林指数评估指标体系包括准备度、平台层、数据层、利用层四个维度及下属多级指标(如图 3 所示):准备度是“数根”,是数据开放的基础,包括法规政策效力与内容、组织与领导等两个一级指标。平台层是“数干”,是数据开放的枢纽,包括发现预览、数据获取、成果提交展示、互动反馈、个性化体验等五个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据规范、开放范围等四个一级指标。利用层是

6、“数果”,是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量等四个一级指标。二、大湾区数林指标数林指标006 图 3 粤港澳大湾区开放数林指数评估指标体系数林指标007利用层数据层平台层准备度数林指标 图 3 粤港澳大湾区开放数林指数评估指标体系008截至 2021 年 6 月,粤港澳大湾区各地开放数林指数等级如表 2 所示,各地指数综合得分可分为五个等级。深圳、香港开放数据综合等级最高,为A+等级;广州、东莞紧随其后,为A等级;其次是江门、澳门和中山等地。在单项维度上,香港在准备度和利用层上表现最优,进入 A+等级;深圳在平台层和利用层上处于领先地位,进入 A+等级。三、大湾区数

7、林指数数林指数 表 2 粤港澳大湾区各地开放数林指数等级009大湾区开放数林指数综合等级的空间分布如图 4 所示,颜色越深代表综合等级越高,综合等级较高的地方主要集中在香港、深圳、东莞、广州这一条绿色“林带”上。图 4 粤港澳大湾区开放数林指数综合等级的空间分布数林指数010本章将重点推介粤港澳大湾区政府数据开放的标杆案例,以供各地进行对标分析。4.1 准备度4.1.1 法规政策深圳制定并公布了地方性法规 深圳经济特区数据条例,如图5所示,其中专门针对公共数据开放作出了要求,如图 6 所示。四、大湾区数林标杆 图 5 深圳经济特区数据条例 图 6 深圳经济特区数据条例中关于“数据开放”的内容条

8、款数林标杆0114.1.2 组织与领导香港的年度开放数据计划由特别行政区政府的各部门分别制定,并在香港资料一线通(DATA.GOV.HK)上发布,如图 7 所示。同时,用户还可以在互联网上方便快捷地搜索到各部门的年度开放数据计划,如图8所示。图 7 香港 资料一线通 首页 图 8 “香港年度开放数据计划”网络搜索截图数林标杆012在数据集开放计划中,香港在资料一线通平台公布了计划开放的数据集列表,如图 9 所示。例如,香港房屋委员会(房委会)/房屋署 在 2021至 2023 年开放数据计划中列明了已开放的数据集和计划开放的数据集,如图 10 所示。图 9 香港年度开放计划-数据集列表数林标杆

9、013 图 10 香港房屋委员会(房委会)/房屋署 2021 至 2023 年开放数据计划 数林标杆0144.2 平台层4.2.1 高级搜索功能深圳、肇庆、佛山平台提供了有多个筛选项的高级搜索功能,并同时支持对数据集和利用成果的搜索,如图 11 所示。图 11 深圳平台的高级搜索功能数林标杆0154.2.2 可按时间段下载历史数据的功能香港平台提供了可按时间段下载历史数据的功能,用户可根据特定时间段下载数据集的各个历史版本,如图 12 所示。图 12 香港平台的按时间段下载历史数据功能数林标杆016数林标杆 图 13 广州平台公开的未开放数据请求和平台回复4.2.3 未开放数据请求深圳、广州平

10、台提供了对未开放数据的请求功能,并对外公开了用户的数据请求和平台的回复,如图 13 所示。此外,深圳平台还对用户的数据请求进行了及时有效的回复,如图 14 所示。017 图 14 深圳平台对未开放数据请求的回复4.2.4 意见建议香港平台在意见建议提交页面特别提醒用户不要提供任何可识别个人身份的信息,以保护用户的自身信息,如图 15 所示。数林标杆018 图 15 香港平台在意见建议提交页面对用户个人信息保护的提醒数林标杆019广州平台对用户的意见建议进行了及时有效的回复(如图 16 所示),并对外公开了用户的意见建议和平台的回复(如图 17 所示)。图 16 广州平台对用户意见建议的回复 图

11、 17 广州平台公开的用户意见建议和平台回复内容数林标杆0204.2.5 数据纠错深圳平台对用户的数据纠错进行了及时有效的回复(如图 18 所示),并对外公开了用户的纠错和平台的回复(如图 19 所示)。图 18 深圳平台对用户数据纠错的回复 图 19 深圳平台公开的用户纠错和平台回复内容数林标杆0214.3 数据层4.3.1 数据数量数据集是指由数据组成的集合,通常以表格形式出现,每一“列”代表一个特定变量,每一“行”则对应一个样本单位。截至2021上半年,深圳、香港和广州开放的有效数据集的总数最高,均开放了超过一千个数据集(如图 20 所示),其次是中山、东莞、佛山、珠海等地。数据容量是指

12、将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数据总量。截至 2021 上半年,东莞平台开放的有效数据集的容量最高,达到 2.6 亿,其次是深圳和香港平台,总容量均超过了 5 千万(如图 21 所示)。图 20 粤港澳大湾区各地平台有效数据集数量(单位:个)数林标杆022 图 21 粤港澳大湾区各地平台有效数据集容量(单位:万)图 22 粤港澳大湾区各地平台单个数据集平均容量(单位:万)报告进一步分析了地方开放的单个数据集平均容量,单个数据集平均容量最高的是东莞,平均容量达到 31 万,其次是惠州、江门、香港、深圳等地(如图 22 所示)。

13、数林标杆0234.3.2 数据质量数据容量大、社会需求高的优质数据集是开放数据的重点。报告对粤港澳大湾区各地平台上所有可下载的数据集(共约 8610 个)按照数据容量进行排序,最终选出排名居于前 1%的数据集作为高容量数据集(共约 86个)。高容量数据集数量的地区分布如图 23 所示,所有的高容量数据集集中在 5 个地方,其中东莞的高容量数据集最多,其次是香港、惠州等地。图 23 粤港澳大湾区高容量数据集的地区分布 数林标杆024 表 3 粤港澳大湾区前十位高容量数据集 表 4 香港平台的前五位高容量数据集数林标杆表 3 是大湾区排在前十位的高容量数据集列表,这些数据集普遍具有较高的条数和字段

14、数,内容涉及面较广,主要涉及工程项目、商事主体、行政许可、交通等方面。表 4 是香港平台提供的前五位高容量数据集,主要涉及地理、交通、环保、选举、研究数据等方面。025 图 24 香港平台提供的历史数据存档与获取数林标杆在开放数据持续性上,澳门、中山、东莞能对平台上已开放数据集保持常态化更新;香港平台为每个数据集留存了可按日下载的历史数据(如图 24 所示)。在“无问题数据”这项指标下,高缺失数据集是指数据集中有 60%以上的空缺数据;碎片化数据是指按照时间、行政区划、政府部门等被人为分割的数据集,不利于数据的融合利用;低容量数据是指因数据量本身稀少或颗粒度过大等原因造成的数据条数在三行或三行

15、以内的数据集,其再利用价值较低;生硬格式转化是指平台将非结构化的 DOC、PDF 等文件生硬地转化成 XLS、CSV、XML 等可机读格式。总体上,存在数据质量问题较少的地方是香港、澳门、东莞、中山、江门等地。0264.3.3 数据规范开放授权协议是指以契约的形式确定数据开放主体和数据使用者之间有关数据利用的权利义务关系,有利于保障和规范数据的合理使用。香港平台在数据使用条款中,对用户须遵守的条件作出了详细的要求,如图 25所示。深圳和江门为平台上开放的所有数据集均提供了可机读格式、非专属格式和 RDF 格式。深圳平台提供了较为规范 RDF 格式(如图 26 所示)。RDF 格式(资源描述框架

16、)作为 W3C 的推荐标准,使用了“主体谓词客体”三元组形式来描述数据资源和它们之间的关系,使数据资源更易于被机器阅读和理解,每一条数据都是一个唯一的资源 URI,有助于数据利用者发现和链接相关数据资源。图 25 香港平台提供的使用条款及条件数林标杆027 图 26 深圳平台为数据集提供了较为规范的 RDF 格式香港平台为每个数据集的字段提供了详细的数据字典。如图 27 所示,在香港平台上的开放数据字典中,提供了数据集介绍、数据集内可获取文件的名称、格式和标注,并为每个字段提供名称、数据类别、内容长度、度量单位、备注等信息。数林标杆028数林标杆029 图 27 香港平台为每个数据集的字段提供

17、数据字典4.4 利用层4.4.1 利用促进深圳举办了 2021 全球开放数据应用创新大赛(如图 28、图 29 所示),推动数据跨域跨界融合,参赛者可利用香港、澳门及珠三角其他八个城市开放的来自政府、企业、社会等多种渠道的数据。数林标杆030 图 28 2021 深圳全球开放数据应用创新大赛 图 29 2021 深圳全球开放数据应用创新大赛利用大湾区多地开放的数据031 图 30 香港平台上展示的成果覆盖了多个领域4.4.2 利用多样性香港平台上展示的利用成果主题覆盖面较广(如图 30 所示),涵盖城建住房、交通出行、卫生健康、社会民生、财税金融等领域。数林标杆0324.4.3 成果数量香港平

18、台上展示的利用开放数据产生的有效成果数量最多(如图 31 所示),达到了 22 个。图 31 香港平台上展示的有效成果 数林标杆0334.4.4 成果质量香港与深圳平台上展示了相对较多的优质利用成果。如:香港平台上的 Citymapper(如图 32 所示)综合利用了公交路线、巴士到站等数据,为市民提供便捷的交通出行引导服务。深圳平台上的小区罗盘(如图33所示)融合利用了交通、文旅等多种主题的开放数据,为市民提供选房指南;图 32 香港平台展示的 Citymapper 服务应用数林标杆034 图 33 深圳平台展示的“小区罗盘”小程序数林标杆0355.1 数根:政策供给与组织保障通过制定政策法

19、规与文件促进和规范政府数据开放,对数据开放要求、数据利用要求、数据开放全生命周期安全管理、保障机制等方面作出规定。制定和公开政府数据开放的总体计划与方案;地方高层领导加大对政府数据开放的重视和支持力度。基于报告总体发现和各地先进经验,提出以下优化建议:5.2 数干:持续运营与改善体验提高数据发现和数据获取的便利度,提供和完善高级搜索和数据集预览功能,降低开放数据获取门槛并提供按时间段下载历史数据的功能,加强对未开放数据请求的回复及公开。增强平台对开放数据利用的支撑作用,完善利用成果提交功能,展示多种利用成果类型及来源信息。提升互动反馈的时效和质量,提供数据发布者联系方式,公开用户对数据集及利用

20、成果的评价,加强对意见建议和数据纠错的回复及公开,提供权益申诉功能,并提醒用户在互动中注意保护自身的个人信息。注重平台用户的体验及获得感,完善收藏和推送功能。五、数林建言数林建言0365.3 数叶:容量提升与描述说明提升有效数据集的数量与容量,开放高容量、高需求的优质数据集。减少高缺失、碎片化、低容量的数据集,保持开放数据集的不断增长和动态更新,并提供历史数据。为单个数据集提供差异化的开放授权协议,在协议中详尽说明责任义务。提高开放数据集可机读格式、非专属格式、RDF 格式的比例,为开放数据集提供丰富的元数据信息和详细的数据字典说明。5.4 数果:数据利用与生态培育促进数据在开放之后的开发利用

21、,包括综合性的开放数据利用比赛和条线性的引导赋能活动,举办跨区域的开放数据创新利用大赛,在粤港澳大湾区营造有利于政府数据开放利用的良好生态。提高有效利用成果的数量和质量,清理与数据开放无关的、由政府自身开发的、无法获取或无法正常使用的成果,为展示的利用成果标明其所利用的开放数据集并提供链接。提高开放数据利用者的多样性,提升利用成果形式与主题领域的多样性。数林建言0376.1 评估范围指数出品方根据公开报道,以及使用“数据开放”“数据公开”“公共数据”“政务数据”“政府数据”“地名数据”“地名政府数据”“地名开放数据”等关键词进行搜索,发现了截至 2021 年 6 月粤港澳大湾区已上线的地方政府

22、数据开放平台,并从中筛选出符合以下条件的平台:1、原则上平台域名中需出现 gov,作为确定其为政府官方认可的数据开放平台的依据。2、平台所代表的地方政府的行政级别为地级及以上。本次评估中,指数出品方共发现符合条件的地方平台 11 个,以此作为本次评估的对象。具体地方、平台名称和平台链接如表 5 所示。六、评估方法评估方法 表 5 评估范围(按拼音首字母排序)0386.2 数据采集与分析方法准备度评估主要对相关法律法规、政策、总体计划与方案、领导讲话的新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在搜索引擎以关键词检索相关法规与政策文本、总体计划与方案、有关地方党政

23、领导讲话支持的新闻报道;二是在地方政府门户网站以及政府数据开放平台上通过人工观察和关键词检索采集数据。评估范围数据采集的截止时间为 2021 年 6 月。平台层评估主要采用人工观察法对各地方政府数据开放平台上各项功能进行观测并做描述性统计分析,数据采集截止时间为 2021 年 5 月。同时,指数出品方还对平台的回复情况(包括回复时间和回复质量)进行了评估,回复情况采集截止时间为 2021 年 5 月。数据层评估主要通过机器自动抓取各地方政府数据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为2021年 5月,对“动

24、态更新”这一指标的评测时段为 2021 年 1 月至 2021 年 5 月。利用层评估主要对各地方政府数据开放平台上展示的利用成果进行了人工观察和测试,对 2019 年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为 2021 年 5 月。此外,为确保数据采集准确全面,对部分指标采用报告出品方自主采集和向地方征集相结合的方式,从各地征集到的公开资料经验证后也纳入评估数据。评估方法0396.3 指数计算方法指数出品方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完

25、全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 分之间的数值作为该项得分。各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以相应权重的加权平均分。各地开放数林指数计算公式如下:评估方法粤港澳大湾区开放数林指数45251218040指数制作团队报告校对组观察员郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖纪昌秀、王翔、毛天慧、韩笑、马李滨蔡伊南、常媛媛、董万怡梦、段晓耀、冯妍、管莹、胡海琛、黄思雅、嵇江夏、姜怀舒、蒋佳钰、景宇欣、李佳欣、李慧瑜、李行行、卢一鸣、莫涛、王芮、王艳梅、王野然、尉苇、吴海珍、肖姝阳、徐丹丹、叶晴琳、于丹、余芊蓉、朱钰谦指数制作方041联合发布方合作单位冥睿(上海)信息科技有限公司中山大学数字治理研究中心晴禾(南京)文化有限公司汇纳科技股份有限公司复旦大学数字与移动治理实验室粤港澳大湾区大数据研究院

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服