1、本文以高质量发展为目标,对大数据基础设施与技术应用能力的双重驱动机制进行分析,验证“梅特卡夫定律”是否能解释大数据发展规律。研究发现,第一,大数据能通过推进市场一体化优化资本与劳动力配置,推进经济高质量发展,且大数据技术应用的积极作用强于数据基础设施。第二,现阶段,数据基础设施与技术应用存在异质性高质量发展效应,前者的积极效应发挥需跨越一定门槛,且存在“适度区间”;后者则呈正向“边际递增”特征,且在数据基础设施支撑下,数据技术应用的“边际递增”效应增强。第三,“邻近合作”有利于激发数据基础设施的高质量发展溢出作用,“技术强强联合”可增强数据技术应用的空间溢出作用。第四,数据技术应用的积极效应发
2、挥存在营商环境与教育水平依赖性,现阶段其仅能激发数字经济产业高质量发展,在传统产业方面动力不足。本文证明了“梅特卡夫定律”在大数据应用中依然存在,有助于加深对数据基础设施建设与技术应用能力提升的认识。关键词:大数据;数据基础设施;数据技术应用;经济发展质量D0I:10.19343/ki.11-1302/c.2023.05.008中图分类号:F202,F6 30文献标识码:A文章编号:1 0 0 2-4 56 5(2 0 2 3)0 5-0 1 0 3-1 7Is Big Data a New Engine for High-quality Economic Development:Interp
3、retation of Dual Effects Based on Data Infrastructure andApplication CapabilitiesWang XinliangZhang JiahaoLiu FeiAbstract:With the goal of achieving high-quality development,the dual driving mechanism of bigdata infrastructure and technology application capabilities is analyzed to verify whether the
4、 development ofbig data follows the“Metcalfe Theorem.It is concluded that:firstly,big data can promote high-qualityeconomic development by promoting market integration,improving government intervention capabilities,optimizing capital and labor allocation,and the application of big data technology ha
5、s a stronger effect thandata infrastructure.Secondly,at the present stage,data infrastructure and technology application haveheterogeneous high-quality development effects.The positive effect of the former needs to cross a certain*基金项目:国家自然科学基金面上项目“我国经济发展质量损失研究:基于财政失衡下地方政府行为偏向的分析”(7 2 0 7 4 1 8 0):国
6、家自然科学基金青年项目“地方政府竞争引致创新要素错配及效率损失研究”(7 1 9 0 4 1 56);陕西省软科学研究计划项目“数据要素市场化配置驱动陕西省数字经济高质量发展路径研究”(2 0 2 3-CX-RKX-077);陕西省社科基金项目“提升陕西数字经济核心竞争力研究”(2 0 2 2 D 1 54)02023年5月统计研究104threshold and has a“moderate interval,while the latter is characterized by a positive“marginal increase,and with the support of da
7、ta infrastructure,the“marginal increase effect of data technology application isstronger.Thirdly,“Nearby cooperation is conducive to stimulating the spillover effect of high-qualitydevelopment of data infrastructure,and“technological alliances can enhance the spatial spillover effect ofdata technolo
8、gy application.Fourthly,the positive effect of data technology application depends on thebusiness environment and education level.At this stage,it can only stimulate the high-quality developmentof the digital economy industry,and has insufficient power in traditional industries.This paper proves tha
9、t“Metcalfe Theorem still exists in big data applications,and deepens the understanding of datainfrastructure construction and technology application capability improvement.Key words:Big Data;Data Infrastructure;Data Technology Application;Economic DevelopmentQuality一、引言随着我国社会主要矛盾变化,单一追求经济增长已无法满足新时代的
10、新需求,贯彻新发展理念、推动高质量发展成为新的发展目标。学界高度关注高质量发展问题,普遍认为“创新”是经济高质量发展的“核心动力”(金碚,2 0 1 8)。2 0 2 0 年,中共中央、国务院印发关于构建更加完善的要素市场化配置体制机制的意见,提出“加快培育要素市场”,大数据作为科技赋能方式,已然成为技术创新的关键,通过与产业发展融合,改变传统生产方式,催生新型业态。据统计,2 0 2 1 年我国数字经济规模为7.1 万亿美元,居世界第二位。那么,大数据能否成为推动经济高质量发展的新“引擎”呢?现阶段,虽有研究从效率提升、产业升级和商业模式创新等维度论证了大数据对经济高质量发展的作用,但缺乏实
11、证分析,未能科学阐释其中的客观效应(李辉,2 0 1 9)。相近研究关注互联网与区域创新、要素效率等关系分析,总体认为互联网对区域创新与经济增长存在正向加速作用,且因互联网存在“梅特卡夫定律”,对创新效率或全要素生产率具有边际递增的影响效应,还因互联网的信息跨时空传播特点对经济发展产生空间溢出效应(郭家堂和骆品亮,2 0 1 6)。大数据作为互联网高度发展下形成的数据集合,其获取、存储、管理与分析都离不开互联网平台,且创新效率、技术效率等都是经济高质量发展的重要驱动。那么,大数据是否也适用“梅特卡夫定律”、是否也表现在经济高质量发展层面,成为现阶段有意义的讨论话题。回答这一问题,需厘清大数据对
12、经济高质量发展的影响机制,但在多变复杂的社会环境下,单一考察大数据和经济高质量发展间因果关系的理论无法适应现实需求。部分研究已表明,在大数据应用于经济业态的过程中,虽然能够激发大众创业活力,释放高质量发展红利,但这一影响效应受制于社会环境、产业结构、经济发展阶段等约束,仅在东部与中心城市作用显著(赵涛等,2 0 2 0)。周青等(2 0 2 0)也证明了数据接入水平、装备、平台和应用能力等对区域创新绩效的影响存在显著差异。那么,大数据对经济高质量发展的影响是否受制于数据基础设施、技术应用能力的约束?是否受到发展环境影响?科学回答以上问题,不仅有助于在新发展阶段验证大数据是否适用“梅特卡夫定律”
13、,且能为深化应用大数据的认识、因地制宜构建发展大数据的可行路径提供理论依据,同时,还有助于挖掘大数据潜力,优化资源配置,加速推进经济高质量发展。资料来源于中国信息通信研究院发布的全球数字经济白皮书(2 0 2 2 年)。计算机网络先驱梅特卡夫指出,网络的价值与节点数的平方相等,表现出网络溢出的边际效应递增特征。王欣亮等:大数据是经济高质量发展的新引擎吗?第4 0 卷第5期105二、理论机制及研究假说(一)大数据影响经济高质量发展的直接机制基于大数据的要素特性,依据新古典经济增长理论,大数据对经济高质量发展的影响机制源于直接生产与组合生产效应。从直接生产效应分析,不同于传统资本与劳动生产要素,数
14、据要素能够通过挖掘、精炼与解读形成有价值信息(Andersen和Ross,2 0 1 3),具有非竞争性、零边际成本特性,不受边际生产力递减约束,能够重复开发应用,同时,伴随着数据集合扩大、使用频率提升、深度挖掘等还将加速信息生成,增强知识生产能力,提升数据要素边际生产力与生产效率,推进经济高质量发展。从组合生产效应分析,大数据通过与劳动、资本等生产要素组合,加速资本深化、提高劳动生产率,推进技术进步,实现经济高质量发展。一是大数据通过增强劳动者的信息搜寻与知识共享能力,加速企业组织内部知识积累,促进新知识产生,提高组织整体精炼、转换、扩展和更新能力,推进经济高质量发展(Zhao等,2 0 1
15、 1)。二是大数据通过提升组织管理者的生产监管与决策能力,既能实现对生产过程监督,增强劳动生产效率,也能降低因信息不对称造成的供给不确定性,提高企业对市场需求的预测能力(Ghasemaghaei和Calic,2 0 2 0),优化生产过程中要素组合,推进经济高质量发展。三是大数据帮助企业技术人员通过信息关联实现描述性洞察,增强技术人员的技术变革与创新能力,并依托互联网平台的信息跨时空传播特性,加速知识溢出,推进技术进步,提高经济发展质量(谢康等,2 0 2 0)。基于大数据赋能技术进步的特性,依据资源配置理论,大数据通过作用于政府与市场主体,进而影响资源配置,间接推进经济高质量发展。从政府调控
16、效应分析,大数据为政府提供可靠数据信息,提高政府宏观调控能力,增强政府治理效率(赵云辉等,2 0 1 9)。一方面,政务服务过程中数据基础设施使各部门、各地区数据互联互通,加速政府间及部门间服务协作,破除行政分割、降低劳动流动管制,加速要素在区域间与部门间流动,促进要素优化配置,推进经济高质量发展。另一方面,依靠对企业大数据分析,能增强政府监管能力,有效防止市场因“劣币驱逐良币”“道德风险”等造成的要素错配。同时,利用大数据,政府能够制定更精准的企业监管与服务方案,有针对性地引导企业提升创新意识,将有限资源投向优势部门,优化资本与劳动要素配置。此外,对金融市场的大数据分析还能增强政府对金融的监
17、管能力,提升信贷资源配置效率,优化区域内资本配置状况,推进经济高质量发展。从市场整合效应分析,市场分割是抑制创新与高质量发展的关键,而大数据为市场整合提供了重要条件。一方面,大数据基础设施快速发展为数据收集、管理提供了硬件基础,促进了大数据政用、民用、商用等全方位发展,有效推动不同区域数据互联互通、开放共享、汇聚融合,加速区域与产业间协调联动,促进要素流动与优化配置,提升要素配置效率。另一方面,数据技术应用改变了劳动者和雇主间的搜寻与匹配机制,通过劳动力市场的大数据挖掘分析,对求职者与岗位形成客观画像(Kuhn,2 0 1 4),快速精准匹配劳动要素,优化劳动要素配置,推进经济高质量发展。同时
18、,大数据开放、共享与挖掘,既能客观刻画企业的运营情况,快速淘汰落后产能,使资本流向朝阳产业,也能降低物理隔绝造成的资本投入风险,提升企业跨区域投资活力,加速资本在区域间流动,优化资本要素配置,推动经济高质量发展。由此,本文提出假设1。假设1:大数据能显著提高经济发展质量,其中,加强数据基础设施或提升技术应用能力不仅能直接推动经济高质量发展,且能通过优化要素配置间接推动经济高质量发展。(二)大数据影响经济高质量发展的非线性机制大数据综合发展水平由数据基础设施与技术应用应用能力共同决定,其中,数据基础设施是指支持2023年5月统计研究106数据集合形成的物理硬件设施,而数据技术应用能力是通过对数据
19、进行挖掘、精炼与解读形成有价值信息的体现(Andersen和Ross,2 0 1 3)。数据基础设施与技术应用能力推动经济高质量发展的机制如下,一是数据基础设施以各类网络相关设备为主,在建设初期网络接入数量不足,组织数据集合成本较高,难以形成可用数据集为政府与市场主体赋能,无法作用于资源优化配置,对经济高质量发展的“激励”效应并不明显。但随着数据基础设施逐步完善,网络接入标准逐步统一,在网络效应的作用下,数据集合成本降低,组织应用意愿增强,数据集合扩大,简单统计或测算就能够完整刻画市场图像,降低信息不对称、提高政府与市场的预测能力,优化资源配置,促进经济高质量发展。二是数据技术应用能力反映组织
20、对信息的分析、处理水平,通过激发组织的洞察力与知识创造减少不确定性,提高组织决策能力,即使是在数据技术应用的初期阶段,也有较多数据分析程序能够满足组织需求,提升组织决策能力,促进资源优化配置(Chen等,2 0 1 5),且陈国青等(2 0 2 1)也证明了小数据可以部分代表大数据的信息刻画能力,驱动组织决策精准化。随着大数据应用技术向纵深发展,经济系统中各组织对数据整合、刻画的能力增强,不仅能推进数据与数据间集合关系所呈现的信息量呈指数化增长(Muller等,2 0 1 8),且能从原有数据中挖掘出更深层次信息,降低组织获取信息的边际成本。此外,随着数据技术应用广度扩大,组织应用数据技术获取
21、超额利润的意愿增强,能够获得更优质、高端的数据技术,进一步提升组织信息挖掘能力,降低组织生产的边际成本,并提高组织规划与决策的精准性,优化资源配置,提高生产效率,如此反复持续和累积循环,促使“梅特卡夫定律”在经济高质量发展进程中成立。但综合分析,数据基础设施是大数据集产生的重要条件,随着数据基础设施不断完善,信息和知识搜索空间迅速扩大,数据间互联、互通与开放共享成本降低,网络效应进一步增强,组织的数据一知识转化能力提升,能通过知识扩散,提升区域整体经济绩效,加速推进经济高质量发展。由此,本文提出以下假设。假设2 a:在现阶段,大数据对经济高质量发展具有非线性影响,即数据基础设施的积极作用显现需
22、跨越一定门槛,数据技术应用能力的积极作用表现出“边际产出递增”特征。假设2 b:除随着数据基础设施不断完善,数据技术应用对经济高质量发展的积极效应增强。(三)大数据影响经济高质量发展的空间机制依据克鲁格曼的“中心-外围”理论,生产要素因本地市场效应与价格指数效应向中心城市集聚,又因拥挤效应导致集聚租金提升,而后向外围扩散,对邻近区域产生空间影响。大数据作为新型生产要素,也存在向中心城市集聚的过程,但因数据要素存在“边际成本递减”特性,致使其不因拥挤效应造成集聚租金上升,同时,要素流动的“冰山成本”来自于数据互联、互通及开放共享的壁垒,若区域间形成大数据发展合力,将有利于降低流动壁垒,激发出大数
23、据集聚与扩散的空间效应。由于大数据发展的具体策略、如何进行数据基础设施建设由各地区自行决策(Chen等,2 0 1 5),邻近区域间决策存在“同群偏向性”,使得邻近区域数据互联、互通标准更易统一,能够以更低成本实现数据开放共享,发生空间溢出效应。此外,在推进高质量发展过程中,企业“创新”是核心动力,创新型企业是否会应用大数据取决于市场环境,市场竞争越激烈时,企业的动态能力发展越依赖于新知识创建,企业越有动力发展大数据。而竞争强度与区域技术发展的整体水平、经济发展阶段等紧密相关,以上特征相似的区域间,因市场竞争压力趋同,企业发展大数据的动力接近,且数据技术应用的成本与预期收益也差异不大,更易形成
24、数据技术应用联合开发战略,从而加速知识与技术溢出,使数据技术应用表现出更强的空间外溢效应。同时,大数据是具有巨大规模和复杂性此处是指要素流动过程中所产生的运输成本和交易成本。归以经济高质量发展(EconomicDevelopmentQuality,简称Edg)为被解释变量,以大数据(Data)王欣亮等:大数据是经济高质量发展的新引擎吗?第4 0 卷第5期107的数据集合,难以使用现有数据管理工具和传统数据处理应用程序及时捕获、处理和管理,致使其在应用扩散时存在一定技术限制,溢出效应更易发生在技术距离相近的区域间。由此提出本文假设3。假设3:大数据对经济高质量发展具有空间外溢效应,但数据基础设施
25、与数据技术应用的空间辐射边界存在一定差异。三、研究设计(一)模型构建1.大数据驱动经济高质量发展的线性回归模型构建。为核心解释变量,构造线性回归模型,如式(1)所示。Edqir=+,Datait+9,Xi,+0,+2,+8itta,+9,X,+0,+2,+6i式(1)中Edq.表示i省份t年的经济高质量发展指数,Data表示i省份t年的大数据发展状况,在具体估计过程中,Data为大数据综合发展指数(Data Comprehensive Development,简称DC)、数据基础设施水平(Data Infrastructure Level,简称D)以及数据技术应用能力(DataTechnolo
26、gyApplicationCapabilities,简称D4)3类,逐一引入式(1)进行估计;为模型的常数项;为大数据的估计系数;X,表示一系列控制变量,9,为其估计系数,k为控制变量个数;8,表示省份固定效应:.表示时间固定效应;8.为随机扰动项。2.大数据驱动经济高质量发展的门限回归模型构建。基于假设2 a,检验大数据是否对经济高质量发展存在非线性驱动效应,构建如式(2)的门限回日模型。Edqi,=+Datai,I(Data,元,)+,Data,-I(,元n-)+9,X,+,+a,+式(2)中,元,表示划分大数据不同水平区间阈值;I(Data)表示大数据是否存在非线性影响的检验函数;9,为
27、大数据不同水平区间对经济高质量发展的影响效应估计系数;其余变量含义与式(1)相同。进一步,基于假设2 b,以数据基础设施水平(D)为调节变量,构建如式(3)的非线性模型,估计数据技术应用能力(D4)对经济高质量发展的动态影响效应。Edg,=o+0,D-I(D,)+0,D1-I(.-I)(3)+9,X,+,+2,+8i式(3)中,表示划分数据基础设施水平的不同区间值,I(D)表示指标函数,指在不同数据基础设施阈值内,数据技术应用能力的高质量发展影响差异;,为数据基础设施在不同水平区间内,数据技术应用能力对经济高质量发展影响效应估计系数;其余含义同式(1)。3.大数据驱动经济高质量发展的空间效应回
28、归模型构建。为检验假设3,纳入空间权重矩阵W:,构建空间面板计量模型:Edgi,=o+pW,Edqu+W,(Data,+X,)+m(Data,+X,)+,+a,+E(4)式(4)为空间计量模型的一般形式,在具体估计时根据相关检验,进行模型优选;p表示空间自回归系数,为解释变量空间交互项系数,M为解释变量系数,M为解释变量个数,W,为空间2023年5月统计研究108权重矩阵,i和j均表示省份。其中,地理距离矩阵(w)利用省份间经纬度计算,当i=j时,w=0;当i+j时,w使用Haversine公式测算所得。经济距离矩阵(WF),借鉴张翠菊和张宗益(2 0 1 5)纳入地理距离与人均国内生产总值(
29、GDP)共同构造的思想,消除单一GDP所造成的内生性问题,即当i=j时,W,=0;当ij时,W技术距离矩阵(W),借鉴陈俊(2 0 2 1)在技术水平基础上纳入地理距离的perGDP-perGDPT思想进行构造,消除单一技术水平造成的内生性问题,即当i=j时,w,=0;当ij时,wi 其中 perTec表技术水平,采用各省份人均专利申请量表征。W为降低空间效应估计偏误,借鉴Kostov(2 0 1 0)的方法,对以上3个矩阵进行优选,结果显示:当D作为解释变量时,技术距离矩阵贡献率最高,适用性最强;当D,作为解释变量时,地理距离矩阵贡献率最高,适用性最强;当D1作为解释变量时,技术距离矩阵的贡
30、献率最高,适用性最强。在此基础上,借鉴陈俊(2 0 2 1)所使用的估计值与真实值偏离程度,分析模型估计结果,进一步精准确认各空间权重矩阵的适用性。(二)变量设定1.被解释变量:经济高质量发展(Ed)。解样支量:经价高顶量友展(Eaq2。学界对高质量发展内涵进行了广泛研究,其中,张军扩等(2 0 1 9)认为高质量发展是满足人民日益增长的美好生活需要的发展,是体现政治、经济、文化、社会、生态文明五位一体的高效率、公平性及可持续发展状态,而任保平和文丰安(2 0 1 8)认为经济高质量发展以新发展理念为指导,包含经济发展的有效性、协调性、创新性、可持续性及分享性等诸多方面。基于以往研究观点,本文
31、认为经济高质量发展是基于新发展理念,形成具有创新动力、协调特征、绿色可持续形态、开放格局以及共享局面的发展态势。其中,创新是经济高质量发展的重要动力,能通过生产效率与技术进步实现经济高质量发展;协调是通过改变资源配置状态,提高资源利用效率,解决经济发展中的不平衡不充分问题;绿色可持续是指经济既要稳定发展,还要与自然、生态形成和谐关系;开放是经济双循环格局的重要基础,也是经济高质量发展的必由之路;共享是经济高质量发展的目标,体现了发展成果惠及人民的程度。鉴于这一内涵,借鉴陈景华等(2 0 2 0)的指标构建方式,从5个层面构建经济高质量发展的测度指标体系。在具体指标构建中,借鉴李勃昕等(2 0
32、2 1)的研究,从区域生产技术和技术创新水平两个维度衡量创新发展,并在可持续发展中纳入系统性金融风险指标,最终,形成包含5个一级指标、1 5个二级指标、33个三级指标的经济高质量发展测度指标体系,如表1 所示。在各具体指标测算后,借鉴聂长飞和简新华(2 0 2 0)的做法,使用纵向拉开档次法确定指标权重,进而利用定基功效系数法进行标准化,将权重与标准化后的数据相乘相加,形成经济高质量发展指数,该指数越大表明经济发展质量越高,该指数与魏敏和李书昊(2 0 1 8)从其他维度构建的指标体系测算结果基本一致,说明本文指标体系构建在一定程度上合理有效。2.核心解释变量:大数据相关指标构建。为推动大数据
33、发展,学者们对其内涵进行了界定,普遍认为大数据以互联网等设施为基础,通为推动大数据发展,学者们对其内涵进行了界定,普遍认为大数据以互联网等设施为基础,通过一定的技术分析产生应用价值(谢康等,2 0 2 0)。鉴于此,本文将大数据发展界定为:基于互联网、系统性金融风险基于银行市场、股票市场与房地产市场三个维度构建包含地区通货膨胀率、存贷比、信贷增速、不良贷款率、财政收入增长率、上市公司市价总值/GDP、股票市盈率、房地产供需比、房地产投资增速9 个二级指标的评价体系,并使用熵权Topsis法测算最终的系统性金融风险值。省和王欣亮等:大数据是经济高质量发展的新引擎吗?109第4 0 卷第5期表1经
34、济高质量发展评价指标体系一级指标二级指标三级指标代理变量/测算方法方向劳动投入投入变量生产技术水平资本投入Malmquist法测算的全要素生产率的技术进步贡献正向产出变量国内生产总值产出创新发展R&D资本投入投入变量R&D人员全时当量技术创新水平超效率SBM测算技术创新效率正向新产品产出产出变量专利授权数人均GDP水平人均GDP的加权变异系数取倒数正向区域协调地区居民消费水平人均消费支出的加权变异系数取倒数正向城乡收入差距城镇居民人均收入/农村居民人均收入负向协调发展城乡协调城乡消费水平差距城镇居民人均消费/农村居民人均消费负向产业结构合理化泰尔指数的倒数正向产业协调产业结构高
35、级化第三产业产值/第二产业产值正向经济产出稳定地区GDP增长率正向资本市场稳定系统性金融风险指数负向稳定发展生产者物价稳定工业生产者出厂价格指数负向消费者物价稳定居民消费价格指数负向就业稳定城镇登记失业率负向森林面积森林覆盖率正向可持续发展环境保护重视力度节能环保支出/财政支出总额正向绿化面积建成区绿化覆盖率正向绿色发展污染气体排放量二氧化硫排放量/GDP负向生活垃圾处理水平生活垃圾无害化处理率正向固体废物排放一般工业固体废物产生量/GDP负向环境污染治理力度环境污染治理投资总额/GDP正向对外贸易外贸依存度进出口总额/GDP正向开放发展利用外资外资依存度外商直接投资额/GDP正向对外投资对外
36、直接投资非金融对外直接投资/GDP正向收入分配平均在岗职工工资城镇非私营单位就业人员平均工资正向消费支出人均消费支出人均消费支出正向共享发展卫生健康医疗卫生水平医疗卫生机构床位数/总人口正向教育支持教育投入力度教育支出/财政支出总额正向休闲福利居民旅游支出居民旅游恩格尔系数正向数字平台等数据基础设施而产生的数据资源,并通过挖掘、精炼与解读,作用于政府、商业与居民行动规划决策能力与业务价值。在这一界定下,从数据基础设施与应用能力两个维度构建指标衡量各地区大数据发展水平。借鉴Williamson(1 9 6 5)的做法,使用加权变异系数测算区域协调度,其测算公式分别为:Gdp1Z(Gdp,-Gdp
37、.)PopitGdp,Popt=1Con,Z(Con,-Con,)o。式中 Gdp.和 Con分别表示人均Gdp 和居民消费支出的加权变异系数,Gdp,和 Con,分别为iCon,Pop.份1 年人均Gdp和居民消费支出,Gdp,和Con,为t年二者的均值,Pop,为i省份t时期的人口数,Pop,为各省t时期人口数。产业结构合理化选用三次产业间从业人员数和产值比例测度的泰尔指数,由于是负向指标,在分析中取倒数处理。居民旅游恩格尔系数=(交通通信+文化教育娱乐+医疗保健/消费支出总额 1 0 0%2023年5月统计研究110(1)数据基础设施水平刻画。数据基础设施以互联网为平台,是数据资源捕捉、
38、获取与收集的基础。综合赵云辉等(2 0 1 9)、王军等(2 0 2 1)对数字经济基础设施的指标体系构建,从传统网络与新型数字基础设施两个维度构建具体指标衡量数据基础设施水平。(2)数据技术应用能力刻画。数据技术应用是指对大数据资源进行挖掘、精炼与解读,形成有价值信息的过程(Andersen和Ross,2 0 1 3),其应用能力则体现在决策规划与业务价值提升等方面(谢康等,2 0 2 0)。本文在张叶青等(2 0 2 1)的基础上,结合中国大数据发展报告的指标体系,从大数据的应用规划与业务价值两个层次,政用、商用、民用三个主体构建大数据应用能力的指标体系,具体见表2。进而使用熵值法对数据基
39、础设施、数据技术应用的各分项指标进行客观赋权,最终加权形成大数据基础设施指数、技术应用指数及总指数。为更直观展示各地区大数据发展水平测度结果,绘制的核密度立体展示图,显示出我国大数据发展综合水平、数据基础设施与技术应用能力均表现出右拖尾状态,未来发展潜力巨大,相关报道也证实了我国大数据发展的这一趋势,印证了指标体系测度结果有效。(3)大数据相关指标有效性检验。为保障大数据相关指标有效,借鉴张叶青等(2 0 2 1)的做法,与其他大数据水平评估指标进行比对检验。当前对大数据进行操作化的指标体系,除本文借鉴的中国大数据发展报告外,另一个更综合全面衡量区域大数据发展水平的指数则来自于中国大数据区域发
40、展水平评估白皮书(2 0 1 7 一2 0 2 1)。鉴于此,从以下两步入手检验:一是检验大数据发展综合水平(DC)与白皮书中大数据发展水平的相关关系,得出相关系数通过了1%的显著性检验,证明了本文构建的大数据发展水平评价指标与白皮书中大数据发展指数高度相关;二是进一步引入控制变量,将白皮书中大数据发展水平变量回归到D,估计结果依然通过了1%的显著性检验,由此进一步证明了本文大数据发展指标体系合理有效。3.其他控制变量。为避免其他影响经济高质量发展的因素造成估计结果偏误,纳入以下控制变量:政府干预度(G o v e r n m e n t),使用财政支出与GDP的比重衡量;人力资本水平(Hum
41、an),使用每万人中高等学校在校人数表征,选取原因在于人力资本与经济的潜在发展能力紧密相关;交通基础设施(T r a n s p o r t),使用当地公路建设里程与城市行政区面积的比值衡量;金融发展水平(Finance),使用当地金融机构存贷款余额与地区生产总值的比值表征。(三)数据说明本文以我国2 0 0 8 一2 0 2 0 年31 个省(区、市)和A股上市公司数据为样本,主要变量数据来源于中国统计年鉴中国科技统计年鉴、CNRDS数据库、国泰安数据库、Wind数据库、部分省份统计年鉴、统计公报及政府网站。其中,云计算中心建设数量、大数据相关政策发布数量和大数据管理机构设置状况在北大法宝数
42、据库、各地政府网站手工检索得到;网上政务服务能力指数来自中国电子政务发展调查报告,社会关注度的关键词资讯与搜索量来自百度指数,衡量企业大数据应用规划能力的关键词词频数,利用Python对我国A股上市公司2 0 0 8 一2 0 2 0 年年度报告进行爬虫获得;数字金融普惠发展指数从北京大学金融研究中心、上海新金融研究院和蚂蚁金服集团共同编制的数据库获取。为保障变量选取科学,对相关性进行了检验因篇幅所限,核密度图以附录1 展示,见统计研究网站所列附件。下同。资料来源:中国电子报,大数据:塑造国家竞争新优势,2 0 1 7-0 8-2 2。因篇幅所限,变量间的散点拟合图以附录2 展示。王欣亮等:大
43、数据是经济高质量发展的新引擎吗?第4 0 卷第5期111表2大数据发展水平评价指标体系分项综合一级指标二级指标三级指标代理变量/测算方法权重权重互联网宽带接入端口数0.06730.0159宽带设施互联网宽带接入用户数0.06910.0164传统网每千人拥有的域名数0.11030.0261络设施传统网络终端设施每千人拥有的网站数0.22230.0526数据基通信线路设施长途光缆线路长度0.06730.0159础设施数字设施投资电子信息产业固定资产投资额0.06810.0161移动电话交换机容量0.06140.0145新型数移动网络设施移动电话基站数0.07140.0169字设施IPV4/IPV6
44、地址数0.18620.0440数据中心建设云计算中心建设数0.07660.0181大数据相关政策发布数量0.05280.0403规划能力(应用程度)大数据管理机构设置状况0.05290.0404政用网上政务服务能力指数0.02170.0166业务价值政府监管质量0.02520.0192政府公共服务绩效0.01740.0133大数据企业关注度企业大数据应用相关词频数0.07750.0591规划能力大数据产业资本投入电子及通信设备制造业R&D资本投入0.09380.0716(应用程度)大数据产业人员投入信息传输、计算机服务和软件业从业人员占比0.09540.0728电信业务总量0.0212
45、0.0162软件产品收入规模0.07370.0563数据技数字产业化信息服务收入规模0.07630.0582术应用商用ICT上市公司数量0.08140.0622业务价值数字经济核心产业企业数占企业总数比重0.06090.0465电子信息制造业企业数量0.08670.0662电子商务交易额0.04950.0378产业数字化有电子商务交易活动的企业数占总企业数比重0.02110.0161数字金融普惠指数0.02440.0187大数据的社会关注度0.01200.0092规划能力(应用程度)移动电话普及率0.01580.0121民用移动互联网用户数占全国用户数比重0.02030.0155业务价值居民交
46、通与通信支出占总支出的比例0.01990.0152注:网上政务服务能力指数、电子商务交易额、大数据社会关注度(百度指数)、数字金融普惠指数在少数几个年份存在缺失,本文根据数据的特征,借鉴杨慧梅和江璐(2 0 2 1)的做法,采用年均增长率予以推算。借鉴赵云辉等(2 0 1 9)的测算方式,监管质量用火灾发生数与火灾受灾面积的比值、交通事故发生数与交通事故伤亡人数的比值、地区生产总值与工业三废排放总值的比值来测量。政府公共服务绩效运用超效率SBM-DEA方法测度,具体选取人均交通运输财政支出、人均教育财政支出、人均医疗卫生财政支出、人均社会保障财政支出、人均传媒财政支出、人均环境保护支出等6 个
47、投入指标;同时,选取交通基础设施密度、医院门诊服务人次、基本社会保障参保、文化活动产出、人均绿地面积等6 个产出指标。借鉴赵宸宇(2 0 2 1)的做法,抓取上式公司年报中“数据管理、数据挖掘、数据网络、数据平台、数据中心、数据科学、数字控制、数字技术、数字通信、数字网络、数字智能、数字终端、数字营销、数字化、大数据、云计算、云IT、云生态、云服务、云平台、区块链、物联网、机器学习”的2 3个关键词,使用词频总数衡量大数据企业关注度。根据社会需求特点筛选出与大数据技术应用高度相关的“数据管理、数据挖掘、数字营销、云计算、机器学习”5个关键词,构造搜索与资讯百度指数综合衡量社会关注度。2023年
48、5月统计研究112四、实证结果分析(一)大数据影响经济高质量发展的线性效应估计为估计大数据对经济高质量发展的直接影响效应,在对各样本数据进行Hausman检验后,使用固定效应模型估计,结果如表3所示。列(1)和列(2)结果显示,无论是否纳入控制变量,均得出大数据发展的总体水平越高,经济发展质量也越高。列(3)和列(4)结果显示,无论是否纳入控制变量,数据基础设施对经济高质量发展的影响效应估计系数均显著为正,即数据基础设施水平提升有利于推进经济高质量发展。列(5)和列(6)的估计结果均显著为正,在列(6)中,当数据技术应用能力提高1 单位,经济发展质量将提升0.7 6 2 5个单位。列(7)既纳
49、入大数据基础设施水平,又纳入技术应用能力后,二者对经济高质量发展的影响系数依然显著为正,且数据技术应用能力的正向效应更大。可见,无论如何调整模型,大数据综合发展指数、基础设施水平和技术应用能力均对经济高质量发展具有显著正向影响,表明利用大数据能有效促进经济高质量发展,验证了本文假设1。表3大数据影响经济高质量发展的线性效应估计结果变量(1)(2)(3)(4)(5)(6)(7)DC2.5162*0.8422*(0.1842)(0.2682)D0.8269*0.3026*0.2459*(0.1685)(0.1311)(0.1320)D42.2210*0.7625*0.5649*(0.1620)(0.2367)(0.2212)控制变量否是否是否是是C0.6072*0.4103*0.8217*0.7640*0.6759*0.4038*0.7456*(0.0279)(0.0669)(0.0322)(0.0884)(0.0230)(0.0671)(0.0885)R20.33460.49540.27290.55860.33640.49610.5637N403403403403403403403注:*、*、*