1、第 31 期2023 年 11 月江苏科技信息Jiangsu Science and Technology InformationNo.31November,2023基金项目:国家自然科学基金面上项目;项目名称:新科技革命先导技术的差距测度、领跑机理与创新跃迁研究;项目编号:71974041。作者简介:周松兰(1969),女,黑龙江密山人,教授,博士;研究方向:世界科技创新。基于论文和专利计量的大数据技术差距比较分析周松兰,邱文伟(广州大学 经济与统计学院,广东 广州 510006)摘要:大数据技术作为人工智能、云计算、物联网等新科技革命信创先导技术的基础资源与核心工具,已成为各国竞争未来发展
2、新优势的新赛道,而跟踪比较其技术差距则为赶超前提。因此,构建新赶超理论和基于知识产权的技术差距测度体系以厘清差距挖掘问题。研究发现,中美欧日韩大数据技术差距已经收敛至 20%区间,呈现典型的并跑阶段特征,中国相关专利和论文有数量优势,但质量有待提高,专利国内外布局不合理。针对问题,文章提出以并跑阶段为重点的赶超全周期创新跃迁路线和政策建议,以期为相关研究和决策提供学术支持和实证参考。关键词:大数据;知识产权统计;技术差距测度;创新路线优化中图分类号:F062.4 文献标志码:A0 引言 以人工智能、大数据、云计算、物联网、3D 打印、智能机器人等为代表的新科技革命先导技术不断演进,大数据作为基
3、础要素与核心工具融合,加速了集成创新,深刻广泛地改变着人类生产生活方式和科技创新范式,推动世界进入大数据时代。大数据是人们在生产、市场、消费和社会活动等过程中,普遍使用计算机、网络、传感及传输等工具和载体,得以快速收集、编译、储存和利用的数字化数据集,其爆炸式增长形成的一种容量大、动态性强、复杂度大的信息资产,区别于传统数据称为大数据,而收集、编译、储存、计算、传输和利用大数据的技术即大数据技术。大数据技术已成为各国竞争未来发展新优势的新赛道,而科学测度和跟踪大数据技术差距是知己知彼的竞争前提。本文以采用论文影响力和专利影响力等知识产权系列指数构建测度工具系统,用以厘清和比较中美欧日韩大数据技
4、术差距,探析问题基源,提出并跑阶段及赶超全周期创新跃迁路线和政策建议,以期为相关研究和决策提供学术支持及实证参考。1 数据来源 大数据技术研究的论文数据,主要通过科睿唯安(Clarivate)与爱思唯尔(Elsevier)数据库检索,主要从论文数量指标和论文被引用率等质量指标两大类进行整理。大数据技术专利数据主要来自世界知识产权组织(WIPO)和中国国家知识产权局(CNIPA)、美国专利商标局(USPTO)、欧洲专利局(EPO)、日本特许厅(JPO)、韩国特许厅(KIPO)即 IP5 局大数据技术专利数据,同时包括中国(CN)、美国(US)、欧盟(EU)、日本(JP)、韩国(KR)等各国籍专利
5、数量和专利家族数量等。2 大数据技术研究的论文数据分析 共检索 19842022 年中美欧日韩大数据技术研究论文 154 449 篇,其中,欧盟 41 716 篇,美国 37 729篇,中国 33 189 篇,日本 20 534 篇,韩国 21 281 篇。从数量增长动态看,1984 年,欧盟 21 篇,美国 17 篇,日本 16 篇,中国和韩国都是 14 篇,说明起步差距不大。从越过 100 篇大关时点看,欧美是在 1995 年,日本是 2000 年,中韩都在 2001 年,东西方拉开 5 年差距,从 2002 年起中国一直保持超过韩国,从 2005 年起中国一直保持超过日本,2021 年中
6、国大幅超越美国,2021 年中国大幅超越欧盟。从发展过程看中国与欧美日韩相差并不遥远,且赶超与反赶超的并跑阶段特征十分明显。大数据技术论文发表数量前 10 位机构依次是中国科学院、美国加州大学系统、中国清华大学、乌迪策法国研究型大学、英国伦敦大学、法国国家科学研究中心、美国佛罗里达州立大学系统、美国哈佛大学、美国德克萨斯大学系统、中国科学院大学。高被引论文是大数据技术研究知识创新产出高质量指标之一。大数据技术研究高被引论文总量:美02第 31 期2023 年 11 月江苏科技信息 知识产权No.31November,2023国 654 篇位居首位,中国 583 篇名列第 2 位。从动态比较看,
7、2012 年中国超过日韩,2014 年超过欧盟,而后一直突出呈现着赶超与反赶超的并跑阶段典型特征,2020 年及以后中国大数据研究高被引论文保持对欧美的赶超。3 大数据技术专利数据分析 共检索 20012022 年在国家知识产权局、美国专利商标局、欧洲专利局、日本特许厅、韩国特许厅申请大数据技术专利 156 071 件。国家知识产权局有108 636 件居世界第 1,日本特许厅有 12 050 件,美国专利商标局有 11 014 件,韩国特许厅有 5 078 件,欧洲专利局有 3 728 件。大数据技术专利申请量前10 位企业依次是中国国家电网公司、中国华为科技有限公司、中国平安科技(深圳)有
8、限公司、日本日立株式会社、日本索尼公司、中国北京百度网讯科技有限公司、日本佳能 INC、美国国际商业机器有限公司、日本电气公司、松下电气工业株式会社。从专利数量上明显可见中国的压倒性优势,但专利质量存在一定的问题。3.1 专利授权率较低仅以基于边缘计算的大数据平台技术专利为例,根据表 1 和表 2 的数据,在 20002022 年期间,国家知识产权局总计有申请专利 11 210 件,总计有授权专利 5 043 件,计算可知授权率为 45.0%,同期同类指标美国 72.5%,欧盟 45.2%,日本 62.4%,韩国65.0%,同样可算出中国籍专利授权率为 41.9%,美国 66.5%,欧盟 61
9、.9%,日本 68.5%,韩国 61.0%。综上,中国的授权率在比较样板中是最低的,主要原因在于专利质量存在差距。表 1 大数据平台技术专利国内外申请结构比较(20002022 年)申请人国籍国家知识产权局/件美国专利商标局/件欧洲专利局/件日本特许厅/件韩国特许厅/件总计/件本国籍者国外申请专利数及与其所有申请专利之比中国8 68227814484539 241559(6.1%)美国1 3227 1411 4011 01372811 6054 464(38.5%)欧盟5641 0767403822012 9632 223(75.0%)日本3326642297651222 1121 347(6
10、3.8%)韩国10324383535851 067482(45.2%)其他2071 049216157951 724总计11 21010 4512 8132 4541 78428 712外国人占有率/%22.631.773.768.867.2 注:据国家知识产权局、美国专利商标局、欧洲专利局、日本特许厅、韩国特许厅官网检索数据整理、计算、制表。下同。表 2 大数据平台技术专利国内外授权结构比较(20002022 年)受权人国籍中国知识产权局/件美国专利商标局/件欧洲专利局/件日本特许厅/件韩国特许厅/件总计/件本国籍者国外授权专利数及与其所有授专利之比中国3 5571786446233 868
11、311(8.0%)美国7485 2345956395007 7162 482(32.2%)欧盟3467513832331221 8351 454(79.1%)日本232489122506971 446940(65.0%)韩国511613429376651275(42.2%)其他1097677378421 069总计5 0437 5801 2711 5311 16016 585外国人占有率/%29.131.070.067.068.012第 31 期2023 年 11 月江苏科技信息 知识产权No.31November,20233.2 国内外专利结构不合理在一国知识产权局申请的专利总数中可能包括本
12、国籍者申请的专利和外国籍者申请的专利,但真正代表一国专利实力的应当是本国籍者的国内专利和本国籍者的国外专利有机集合。而国内专利和国外专利的比例有着不同价值含义:一国国内专利越少同时国外专利越多,意味着被外来技术占领国内产业和市场的潜在风险;一国国内专利越多同时国外专利越少,意味着国内有一定的自主能力而缺乏国际竞争力。中国籍者在除中国之外 IP5 局的国外申请专利数为 278+144+84+53=559(见表 1),与中国籍者所有申请专利总数 9 241 之比为 6.1%即国外专利申请率,这类指标美国为 38.5%,欧盟为 75.0%,日本为63.8%,韩国为 45.2%,可见中国低了数十倍,这
13、与前述中国专利数量是其他比较样板的数十倍形成了强烈反差,是中国大数据技术专利数量领 先而国际竞争力较低的原因之一。如表 2 所示,中国大数据技术专利国外授权率 8.0%,低于美国 32.2%、欧盟 79.1%、日本 65.0%、韩国 42.2%的数十倍。而且这类格局与大数据其他技术分类专利大同小异,因此,中国在具备专利数量优势基础上不容盲目乐观,还应提高专利质量,优化专利布局的国内外结构。4 大数据技术差距测度与比较4.1 技术差距测度方法 技术差距测度的模型采用周松兰1的方法,利用论文活动力指数、论文影响力指数、专利活动力指数、专利影响力指数、专利市场力指数,组合构建大数据技术差距测度的评分
14、模型 BDII=5i=1PLi。其中,P 为权重;Li为 5 种指数的评分值。以计量结果最高者为百分,计算中美欧日韩大数据技术差距,形成技术差距追赶曲线,并进行比较分析(见图 1)。图 1 中美欧日韩大数据技术追赶曲线动态演进4.2 大数据技术差距测度结果与追赶曲线比较分析 2000 年,以最高技术国家美国大数据技术水平为 100 分的标化评分,欧盟 78.4 分,日本 73.7 分,韩国 60.6 分,中国只有 50.1 分。中国经过 10 年的追赶,至 2010 年达 59.1 分,2012 年越过 60 分线,从此基本以平稳斜率和速度在与其他经济体并跑中接近超越。从 70 分线年份看,韩
15、国是 2010 年,中国是2016 年,比韩国迟 6 年。而从越过 80 分线年份看,韩国是 2018 年,中国是 2017 年,比韩国提前 1 年,并从此保持对韩国的超越。在国家创新驱动科技由跟跑向并跑、领跑转型的新赶超战略推动下,中国大数据技术创新从 2018 年开始保持超越日本,2019 年开始保持超越欧盟,2021 年中国大数据技术评分达到95.6 分历史高点,进入与美国并跑阶段。2022 年大数据技术评分,中国 93.8 分,欧盟 88.7分,日本 80.3 分,韩国 89.4 分,与近年动态结合可见五大经济体大数据技术差距收敛已接近 20 分内的狭窄区间,显示出典型的并跑阶段特征之
16、一;欧盟和日本长期以来在 80 分线徘徊,显示典型的并跑阶段特征之二。总体格局表明,中国大数据技术创新已进入与欧美日韩并跑的历史性新阶段。5 政策建议 (1)推动人类命运共同体建设与人类大数据共同体建设同步相生。随着中国大数据技术水平的提高,中国智能化大数据发展惠及世界,世界大数据离不开中国2。人类是休戚与共的命运共同体,只有和衷共济、和合共生地建设人类大数据共同体,才能更好地面对数字技术和数字经济的挑战。中国应积极融入全球数据规则和标准制定的主流,成为全球数据治理的主要贡献者和领跑者。(2)从政策源头为科研机构和企业技术创新提高专利质量,增强“造血”功能。重点支持核心技术家族专利,完善优化专
17、利国内外结构的预警机制、激励机制和政策机会窗口,培训、指导、监督专利代理系统科学优质运行,从基础服务22第 31 期2023 年 11 月江苏科技信息 知识产权No.31November,2023上提高专利申请质量,从战略布局上引导和提升专利家族系统质量3-4。(3)技术创新、制度创新和社会创新联动,系统优化大数据技术发展基础,以胜出并跑,跃迁领跑。鉴于中国当前大数据等先导技术进入与主要国家并跑的阶段特点和发展要求,一是要优化创新工具系统,二是要提高创新能级。在技术引进消化吸收再创新的跟跑阶段,形成了中国对国外诸如芯片等核心技术的依赖,在并跑阶段要加强信创的基础硬件、基础软件、应用软件、信息安
18、全建设,加快实现开源系统、操作系统、根服务器等自主可控。同时,发挥大数据应用场景和行业大数据市场优势支持大数据技术产业化升级5-6,尤其要提高全民和机关企事业组织数字化素质,优化大数据技术普及与提高的基源。集聚与培育大数据技术各类人才,提升大数据技术及与人工智能、云计算、物联网等技术的相生促进与融合创新能力。参考文献1周松兰.中美欧日韩人工智能技术差距测度与比较研究J.华南理工大学学报(社会科学版),2020(2):18-30.2王雅,杜涛,贾鑫.大数据技术的专利竞争态势与中国企业的对策J.成都工业学院学报,2020(1):69-72.3左良军,李立功.基于大数据技术的专利价值评估与筛选系统
19、J.中国发明与专利,2018(10):41-44.4汪满容,刘桂锋,孙华平.基于专利地图的全球大数据技术竞争态势研究J.现代情报,2017(1):148-155.5赵向阳,王亮,梁晨陇.基于专利数据的大数据技术发展研究J.软件,2017(8):190-196.6卜婷婷,杨潇.大数据领域专利技术分析J.科技创新与应用,2023(4):21-24.(编辑 李春燕)Comparative analysis of big data technology gap based on paper and patent measurementZhou Songlan Qiu Wenwei School of
20、Economics and Statistics Guangzhou University Guangzhou 510006 China Abstract Big data technology as a fundamental resource and core tool for leading technologies in new technological revolutions such as artificial intelligence cloud computing and the Internet of Things has become a new track for co
21、untries to compete for new advantages in future development.Tracking and comparing their technological gaps is a prerequisite for catching up.Therefore a new catch-up theory and a technology gap measurement system based on intellectual property rights are constructed to clarify the problem of gap mi
22、ning.The study found that the big data technology gap between China the United States Europe Japan and South Korea has converged to a 20%range showing typical parallel running characteristics.China has a quantitative advantage in related patents and papers but the quality needs to be improved and th
23、e domestic and international layout of patents is unreasonable.To address the issue propose a path and policy recommendations for catching up with and surpassing the full cycle innovation transition with a focus on the parallel stage in order to provide academic support and empirical reference for relevant research and decision-making.Key words big data intellectual property statistics measurement of technology gap innovation route optimization32