1、White Paper of 2021 AI Competition2021人工智能竞赛白皮书数据科学协同平台前言第一章 人工智能竞赛是数字经济创新发展的重要推动方式一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式三、人工智能竞赛为各行业数字化转型创新持续输出动能第二章 人工智能竞赛是敏捷的数据探索与应用创新方式一、数字化转型成本高昂,暗藏诸多风险二、整合关键创新要素,快速实验创新应用三、低耗高效可持续,生态化创新动能不断第三章 人工智能竞赛帮助促进高校的学科交叉与产研融合一、促进高校加强学科建设与学科交叉
2、二、推动科研机构加速产研融合与技术发展第四章 选手眼中的人工智能竞赛一、为什么参加人工智能竞赛二、希望通过参赛收获三、认为竞赛对自己的意义1.自我效能感2.内部满足感3.外部报酬第五章 组织人工智能竞赛的挑战一、对竞赛复杂性的调研结果1.主办方对竞赛有高预期2.参赛者对竞赛有严要求二、人工智能竞赛的运营复杂度详解1.数据科学项目管理,支撑赛事成果有效性2.保障赛事相关方体验需要面面俱到第六章 如何组织一场人工智能竞赛一、人工智能竞赛的关键要素二、人工智能竞赛的必备条件CONTENTS0304050508 101112141718192122232424242526272728303033373
3、8391.贴合实际场景的需求分析和赛题设计2.审慎的数据筹备与质量管控3.科学有效的竞赛成果评价机制4.平衡成本和效率的计算资源管理与配给三、人工智能竞赛的八大保障1.数据脱敏、防泄漏等安全保障2.公平公正严防作弊的竞赛环境3.参赛选手享有流畅的闭环体验4.云端竞赛环境突破本地配置局限5.数据科学平台与赛事管理系统的应用6.即时高效的赛程运营与服务响应7.多种针对性的辅助活动保障8.数据科学人才社区提供人才保障第七章 覆盖多领域的人工智能赛事案例赛事导航一、政府赛事二、科研赛事三、产业赛事四、高校赛事第八章 人工智能竞赛生态版图与竞赛平台和鲸社区阿里云天池华为云大赛平台DataFountain
4、DataCastleKaggle(国外)第九章 人工智能竞赛的五大趋势与展望一、奖金投入意愿攀升,参与规模稳增二、数据红利可期,数据投入姿态积极三、教育投入与日俱增,数据人才能力跃升四、应用场景不断扩散,标杆行业优势初显五、商业数字化趋势渐强,有赖技术创新落地六、人工智能竞赛驱动的创新生态展望附录39404143454547495151535455565758636773788080808181828384858587888991前言数字科技正逐渐渗透到经济、商业、社会生活方式等方方面面,人们对于数据智能时代的来临充满了期待。然而,从现阶段的发展来看,我们距离真正的大数据时代仍有距离,各行各业
5、的数字化转型进程未能如期落地。数据的力量究竟该如何激发?带着这样的疑惑,我们把视角对准了人工智能竞赛这一载体,以期为行业提供启发。通过全面的调研、分析,我们得到了寻找创新路径和探索最佳实践的总结,形成这份人工智能竞赛白皮书分享给大家。全球人工智能竞赛已经历了 20 余年的探索,其发展起点可追溯至 1997 年由国际顶级学术会 议 KDD(Conference on Knowledge Discovery and Data Mining,知识发现和数据挖掘会议)推出的 KDD Cup。此后,一系列国际顶尖学术会议也陆续牵头组织人工智能竞赛。国际顶会人工智能竞赛往往会积极兼顾市场应用的需求,通过与
6、企业、政府机构合作,聚集当下 技术与数据应用中的难点寻求解决思路,不断缩短科研成果与落地应用之间的距离。创立于 2010 年的 Kaggle 作为目前全球最大的数据科学技术分享社区,更是为人工智能竞赛的平台化发 展奠定了模式化基础,其合作伙伴除了 Google、Facebook、Airbnb、Yelp 等互联网时代诞生的巨头,亦不乏 Walmart、Airbus、Genentech 等声名日久的传统行业领头羊。放眼中国市场,人工智能竞赛自 2014 年萌芽以来,数量每年以翻倍之势增加,主导者不乏权威的 科研机构与高校,亦有来自各行各业的领军企业。身担城市管理与民生重任的政务机构也在“大众创业、
7、万众创新”的政策驱动下,开始意识到数据的力量,牵头组织了多场大型人工智能竞赛。人工智能竞赛绝不仅仅只是“主办方发布赛题、传播品牌美誉,参赛者参与开发、收获丰厚奖金”的公关活动。对双方而言,人工智能竞赛已经成为了数字化转型的“云端实验室”,很多领先机构已经把人工智能竞赛当作是他们最佳的“数字化练兵场”、“数字化人才挖掘器”和“数字化生态构建器”。主办方紧跟数据智能的发展趋势,通过挖掘数据价值的场景和树立“数据+算力+人才+算法”的价值闭环,积累数据科学研发的核心能力;参赛选手能够积累如何在真实业务场景中应用先进技术的实际经验,在与众多高手的交流切磋中不断成长。基于这一现状意义,在中国人工智能产业
8、发展联盟(AIIA)的指导下,和鲸科技携旗下中国领先的第三方人工智能竞赛平台“和鲸社区(H)”,联合中国信息通信研究院数据研究中心、北京邮电大学人工智能学院、人工智能开源社区“DataWhale.club”,共同发布2021 人工智能竞赛白皮书,分析全球市场人工智能竞赛发展趋势,提出对人工智能竞赛推动前沿技术落地的创新价值思考,并在业界开源优质人工智能竞赛运营方法论与最佳实践。第一章人工智能竞赛是数字经济创新发展的重要推动方式一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式三、人工智能竞赛为各行业数字化转型
9、创新持续输出动能在国家层面,人工智能竞赛助力数字经济创新发展,突破重点技术瓶颈,推动人工智能产业高质量发展。2017 年 7 月,国务院印发新一代人工智能发展规划的通知,人工智能正式上升至国家战略层面,此后各类关于加快推进数据应用的政策相继出台。可以看到,在国家宏观政策的大力推进和坚实支持下,大数据、云计算以及人工智技术的不断迭代和成熟正在催生日渐规模化、网络化和生态化的内生驱动的生态经济体,其基础都在于借助算法和算力实现对数据价值的洞察。人工智能竞赛活动是人工智能技术创新、产业应用实践、赋能数字经济改革创新的重要方法。通过组织各类人工智能竞赛活动可汇聚各方技术力量,共同研究突破关键技术瓶颈,
10、解决人工智能技术应用落地难点,并提升公众对人工智能技术的认知。我国各省、市贯彻国家创新驱动战略,结合各地人工智能产业特色,举办各类人工智能创新、创业大赛,推动人工智能技术在各行各业的应用创新及成果转化,汇聚人工智能专业人才,促进地方人工智能产业发展。多地举办面向不同人群的人工智能竞赛,当前,全球多个国家发布人工智能国家战略,并在战略中指明应加强人工智能竞赛、合作研讨,实现本国人工智能技术的重大突破,并通过竞赛方式促进人工智能解决方案的开发,恢复本国经济增长。部分国家政府部门牵头组织竞赛,成果解决人工智能相关的科学和工程问题。可以看到,以人工智能竞赛作为载体,以问题为导向,以人才为抓手,汇聚人工
11、智能领域的各界科技创新力量和智慧,在共同推动人工智能+产业发展,加快算法产业化进程中起到重要作用。人工智能竞赛作为人工智能赋能数字经济改革创新的重要手段和窗口,也越来越受到各国的高度重视。覆盖从学生教育、专业技术人员,到行业专家的不同类型竞赛活动,既促进人工智能技术的普及,又面向具有应用价值的场景,探寻技术解决方案。一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式助力政府实践产业落地和建设数据创新生态在“大众创业、万众创新”的号召下,在政府资金、政策和转型决心的支持下,政务部门在大力倡导政务管理数据化、智能
12、化的同时,也成为了有序开放优质公共数据资源、释放公共数据红利的引领者,为建设数据创新生态建设提供着政策支撑和资源支持。如何借助数据科学建设智慧城市,是政务机构面对的重要问题。政务部门的数据积累具有数量更大、来源更多、质量更好、纬度更广等特征,其应用领域遍布城市管理的方方面面。为了探索数据科学在城市管理中的应用可能性,政务机构较为偏好开放性的产品方案赛题。具有明显的行业标签,如教育局、交通局、气象局等,赛题应用场景多与其自身行业标签一致;而没有明显行业标签的政务机构,如人民政府,其赛题场景则非常广泛。人工智能竞赛是数字经济创新发展的重要推动方式 05人工智能竞赛是数字经济创新发展的重要推动方式
13、06图 1-1 政务部门类赛事主办方的赛题场景分布和技术类型分布数据来源:和鲸科技()经调研统计得出。引用请注明出处。7.2%21.4%31.4%40.0%案例特写:医疗大数据 Datathon产研协作树立医疗数据创新应用的标杆赛事主办方:中国医院协会医学工程专业委员会/中国医疗设备杂志社 2019 年第四届 PLAGH-MIT 医疗大数据 Datathon 于 11 月在北京召开。这一数据实践活动最初由麻省理工大学团队和哈佛医学院团队发起,由中国人民解放军总医院率先将该模式引入国内,旨在融合海量医疗数据物基础上,汇集医疗专家、数据科学家、统计分析师等不同知识背景和专攻技术领域的参与者,利用真
14、实的医疗数据,通过组队协作以项目竞赛的形式解决临床医学面临的众多问题和未满足的医疗需求。通过跨学科合作竞赛的创新模式,Datathon 激活了海量医疗大数据的实用价值,成为数字化创新趋势下高效、敏捷、低耗的练兵场前期的训练营阶段集合了医疗、数据、计算机等不同学科背景的人士,组织进行专业知识的互通交流和学习,快速打通专业壁垒;在正式竞赛阶段,不同背景的参与者通过优势互补的组队构成了数字化创新的基础组织单元,在竞赛环境中协作挖掘医疗数据的应用潜力、探索解答临床实践中遇到的问题,为如何开展医疗大数据研究提供了新思路。迄今为止,医疗大数据 Datathon 已在全球范围内持续组织了 40 余场,历年赛
15、题方向广泛,涉及了影像报告的自动语意分析与信息提取、基于急诊大数据的急性高乳酸血症短期治疗效果预测评估模型构建的研究、以及消化道出血发病风险与气象条件之初步探究等丰富的内容,有效推动了医疗大数据的实践应用落地。Datathon 为医疗研究提供了一个突破时空、地域、文化和学科限制的创新协作平台,项目成果的开源共享和不同观点的激烈碰撞促进了数据和技术在临床医疗领域发了更广泛、更持续的创新价值。科学转化医学期刊评论案例特写:“莱斯杯”全国第二届“军事智能机器阅读”挑战赛军事领域的前沿科研探索赛事主办方:中电莱斯信息系统有限公司 中电莱斯作为我国军事科研的重要力量通过人工智能竞赛积极探索 NLP(自然
16、语言处理)的前沿发展,赛题内容将 NLP技术应用于对真实中文文本段落的阅读理解,要求参赛选手训练的算法模型能够基于对多篇文章的内容定位和深度理解,为测试集中给定的问题找到最优答案。人工智能竞赛将语料库数据、NLP 技术和人才加以串联,并提供了云计算资源和协作开发工具等基础设施,以阅读理解与推理问答的竞赛成果为基础,创造性地探索了 AI 技术在军事场景的应用价值,将有望颠覆以往情报整编工作以人工分析提炼为主的模式,逐步实现由机器替代繁琐、重复性情报整编业务流程。作为中国在军事领域进行 AI 创新探索的标杆案例,该人工智能竞赛也将加强中电莱斯对于中文语料库建设的信心。表 1-1 人工智能竞赛对科研
17、机构的价值总结人工智能竞赛的亮点价值融合丰富的资源支持开辟创新的科研价值探索路径释放前沿科研的实用价值树立起前沿科研成果创新应用探索的标杆与工业界进行紧密合作促进了跨学科领域产研交流前沿科研进展科研标杆产研交流数据来源:和鲸科技()经调研统计得出。引用请注明出处。人工智能竞赛是数字经济创新发展的重要推动方式 07图 1-2 不同发展周期的前沿技术在各行业场景中的应用分布数据来源:和鲸科技()制作。引用请注明出处。GPU在各类人工智能竞赛活动中,赛事汇聚产学研各领域专家,实现以问题为导向的产学研协同创新。通过举办选拨各行业优秀的人工智能创新应用方案,加速形成各细分领域的人工智能应用共识和标准。备
18、注:以下数值为各行业应用 AI 前沿技术的总指数得分,从左到右依次排名三、人工智能竞赛为各行业数字化转型创新持续输出动能人工智能竞赛是数字经济创新发展的重要推动方式 08图 1-3 2006-2020 年 CASP 比赛中最佳蛋白折叠预测系统的评分表现图片来源:DeepMind Blog伴随着技术水平的日趋成熟,越来越多的行业开始尝试融入信息技术,技术落地也成为数字化创新的首要目标。组织机构希望加入数字化转型的趋势性浪潮,然而,数字化却面临着诸如抗拒改 变的文化氛围、有限的分享和协作、业务尚未准备就绪、人才短缺、现有实践不适宜进行数字化、以及成本投入巨大等多方面的挑战。对绝大多数组织机构而言,
19、推进数据科学项目耗时漫长、所费不赀。从集思广益提出创意,到通过审慎评估形成切实可行的方案,继而投入大量尖端人力进行算法开发,成果新鲜出炉后投入现实场 景加以应用验证,再到确定其效果与回报后推行全面部署每 一个环节都会牵涉到大量资源的协调投放与各方利益诉求的平衡,更少不了富有预瞻性的战略判断、科学专业的运营管理、以进而可以看出,在行业层面,人工智能竞赛在实现以问题为导向的产学研协同创新,选拨各行业优秀的人工智能创新应用方案,以及加速形成各细分领域的人工智能应用共识和标准方面都能够发挥重要作用。及发现误差后能够进行敏捷的优化调整。因此,人工智能竞赛为数据驱动的技术创新落地和数字化转型升级提供了充沛
20、的生产力。例如,近年来知名度提升的国际蛋白质结构预测竞赛(CASP)由马里兰大学的 John Moult 教授和加州大学戴维斯分校的Krzysztof Fidelis教授联合创建的国际性比赛,旨在评估、促进和确认最佳的蛋白质结构预测手段。2018 年,DeepMind 开发的第一代 AlphaFold 首次参加 CASP 并且拔得头筹。而 2020 年,新一代的 AlphaFold2 在 CASP 中的表现更为惊艳,其评估结果比 2018 年提升了,被媒体誉为“解决生物学50 年来的重大挑战”。Median Free-Modelling AccuracyCASPALPHAFOLDALPHAFO
21、LD 2 CASP72006100806040200CASP82008CASP92010CASP102012CASP112014CASP122016CASP132018CASP142020GDT人工智能竞赛是数字经济创新发展的重要推动方式 09第二章人工智能竞赛是敏捷的数据探索与应用创新方式一、数字化转型成本高昂,暗藏诸多风险二、整合关键创新要素,快速实验创新应用三、低耗高效可持续,生态化创新动能不断作为赛事主办方,通过人工智能竞赛可以提升数据资产的利用价值、挖掘高质量数据人才、征选优质的人工智能应用方案、以及构建自身的开放创新的数字化生态,在这些方面人工智能竞赛都有着得天独厚的优势,可以把它
22、看作为是一种敏捷的价值探索与应用创新的手段。数字化创新需要不同的技能、工作实践、组织模式甚至是文化。要让一个为结构化的、有序的、面向流程而设计的组织,变成为生态系统、适应、学习和 实验设计的组织,是非常困难的。Gartner 研究副总裁 Marcus Blosch一、数字化转型成本高昂,暗藏诸多风险提出创意-创意盲区-创新动力不足-创意是实情割裂.形成方案-创意天马行空无法收敛-落地难度大-落地成本高.算法开发-数据储备不足、质量差-技术实现难度大.应用验证-效果与预期有出入-测评方式不科学-应用效果反馈周期长全面部署-全面部署成本高-模型时效性强,优势很快丧失-回报周期长数据科学项目的推动需
23、要经历一系列艰难环节,但凡有一环节出现迟滞或脱节,都有可能导致重大损失,或在瞬息万变的数字化时代丧失创新发展的先机。推进数据科学项目每一环节都面临着诸多难题人工智能竞赛是敏捷的数据探索与应用创新方式 11引领企业进行技术落地场景的创新探索企业举办人工智能竞赛的核心诉求,是挖掘潜在的创新方向和应用场景。通过人工智能竞赛的举办,企业打造出了充分融合数据、算法、人才、算力等各项创新要素的标杆案例,以赛题要求切入,让创新探索过程更加具象、创新探索结果更加明确,为企业的数字化投入建立信心。同时,人工智能竞赛作为数据研发的缩影,也成为了企业积累数据科学能力的实验室。在贴近真实业务场景的竞赛环境下,为可复用
24、的数据科学方法论指导赛事设计与运营,厘清数字化转型的目标与路径,把握数据科学项目的生命周期,更加有的放矢地制定策略。分析 2014 年至今国内的 400 场人工智能竞赛发现,企业在所有人工智能竞赛主办方中占比高达 67%,金融、通信、文娱传媒、交通运输和电子商务是发起人工智能竞赛数量最多的五大行业领域,合计占比高达 75%。企业最为偏好结构化数据挖掘类赛题(47.4%),其次是计算机视觉(21.6%)。具体来看,金融行业赛事主办方的赛题场景相对发散,除金融关联领域外,亦涉及电子商务、交通出行、农林养殖业、新零售等“金融+”场景。通信行业在 5G 技术的商用趋势与产业互联的影响下,还会关注安防、
25、交通、旅游、人文、社会治理、及文娱传媒等“万物互联”和“智慧城市”等相关领域。数据来源:和鲸科技()经调研统计得出。引用请注明出处。图 2-1 企业类赛事主办方的赛题场景分布和技术类型分布7二、整合关键创新要素,快速实验创新应用人工智能竞赛是敏捷的数据探索与应用创新方式 12人工智能竞赛连接起的每一项要素都在数字化创新中扮演着不可或缺的重要角色:云计算资源和数据科学协同开发工具是基础设施,人才和 AI 技术是生产力,数据是基础生产资料,环环相扣的创新效果通过以赛题承载的应用场景得以直观呈现。以人工智能竞赛为中轴,汇聚起更多的人才、组织起更频繁的跨学科领域交流、涉足更广泛的技术面,积累更全面更优
26、质的数据,从而带来更加敏捷高效的创新探索和性能突出的创新成果。与收益不断高企相伴的是成本的逐步下跌:由竞赛催动的规模经济促使基础设施的研发成本不断摊薄;通过竞赛培养和积累的核心能力也让获取数据科学研发经验和制定竞赛制度与标准的边际成本不断减少;规模日益巨大的数据科学人才在向竞赛输入其专业能力和创造力的同时,也在获取持续的实践训练和成长,人才聚集和培养成本得以压缩;社区为交流互动提供了发声地,工具为团队合作提供了功能保障,协作不再成为难点。创新的巨轮一旦转起,就会越来越快,最终开拓出更多有效果有价值的应用场景,实现令数字化价值指数级增长的飞轮效应。兼具性价比、敏捷性、持续性的人工智能竞赛带来数字
27、化价值指数级增长的飞轮效应人工智能竞赛是敏捷的数据探索与应用创新方式 13人工智能竞赛是敏捷的数据探索与应用创新方式 14三、低耗高效可持续,生态化创新动能不断竞赛低耗高效可持续,创新探索敏捷化各类组织机构不懈探索更简单、更便捷的数字化战略,根据Gartner 在 2017 年发布的数字化战略调研报告,在众多数字化创新手段中,人工智能竞赛依然具有相对较高的成功率。因为在确 性价比:人工智能竞赛创造了化繁为简的环境条件,在更加紧凑的周期内,能够直接感受推动数据科学创新和技术落地的步骤与方法。无论是自行成立数字化研发中心,还是与产业同行进行战略合作,往往首先需要在 IT 基础设施上有巨大投入,而在
28、竞赛环境里,赛事主办方往往只需要承担一个业务负责人的角色,与竞赛运营平台沟通其创新诉求,配合轻量级的付出即能够获得赛事运营团队和数据科学研发人员的专业服务与支持。敏捷性:传统的数据科学项目受限于团队人数和团队精力,信息反馈也往往需要较长的周期。而人工智能竞赛由于其特殊的赛马机制,模型迭代的速度和对于数据的利用效率往往远高于常规的数据科学项目。作为缺乏前车之鉴的创新之举,推进数据科学项目总少不了反复的试验和排错,传统方式下的每一次试验往往因投入巨大可能导致决策者投鼠忌器。但籍由人工智能竞赛以更经济的投入换取更快速的反馈,便为多轮连续验证创造了空间,实现了敏捷的创新。保有 100%的信心推动数据科
29、学项目成功着陆之前,人工智能竞赛在性价比、敏捷性和持续性等方面表现突出,不仅有利于低成本的发展策略试验和排错,亦能充分积累数据科学实战经验。数字化创新方法投入对比图 2-2 不同数字化创新方式的成本、耗时和成功率对比 持续性:以人工智能竞赛为契机,加强企业、高校和科研机构、政务部门之间广泛深入的合作,促进多方资源的整合与联通,既是促进产教融合的数据科学人才培养模式变革的创新之举,也为研协同打通了渠道、树立了标杆,为可持续的技术创新应用探索提供了基础设施平台,市场价值必将迎来指数型增长。数据来源:和鲸科技()制作。引用请注明出处。人工智能竞赛是敏捷的数据探索与应用创新方式 15表 2-1 人工智
30、能竞赛对企业的价值总结人工智能竞赛的亮点价值技术落地应用场景探索,挖掘潜力项目检验 AI 投入与建设效果,优化创新战略压缩试错成本,敏捷迭代创新思路和方向积累推动数据科学自研的核心能力建立跨学科背景人才的交流学习机制多元思维碰撞,保持与最新技术趋势的同步性将数字化建设成果与社会进行及时的分享树立起科技驱动、AI 持续投入的前沿形象打造 AI 技术和云计算资源的应用标杆案例加强数据资产的积累、治理与应用提升技术投入信心创新探索数据科学能力产研交流企业形象技术应用标杆数据来源:和鲸科技()经调研统计得出。引用请注明出处。各类赛事主办方的数字化创新需求与难点通过人工智能竞赛得到了满足人工智能竞赛是敏
31、捷的数据探索与应用创新方式 16人工智能竞赛第三章人工智能竞赛帮助促进高校的学科交叉与产研融合一、促进高校加强学科建设与学科交叉二、推动科研机构加速产研融合与技术发展人工智能竞赛帮助促进高校的学科交叉与产研融合 18一、促进高校加强学科建设与学科交叉促进高校加强学科建设与人才培养在国家相关政策的鼓励和推动下,越来越多的高校开始进行数据科学的学科建设和人才培养。高校学科建设需要持续的资金投入和资源配套,数据相关专业仍缺乏成熟的学科建设经验,学生则需要充足的优质数据、功能完备的工具平台和贴近实战的场景来进行实践这一系列问题都是困扰着高校的现实困难。人工智能竞赛作为高校推进大数据相关学科建设的重要手
32、段,将教学、科研、实训深度结合,以赛题的形式发布,广泛吸引校内的人才参与竞争和交流学习,探索将理论知识转化为实践应用,帮助人才在竞赛场景中以赛促学,帮助人才认识理论学习、基础知识的意义与重要性。在此背景下,高校围绕技术热点、学科建设以及创新应用三个方向进行赛题的策划,广泛涉及社会服务、工业制造、旅游、生物科技、网络安全和医疗健康等多个行业,以加强学生的理论和技能在多元场景下的应用能力。数据来源:和鲸科技()经调研统计得出。引用请注明出处。图 3-1 高校类赛事主办方的赛题场景分布和技术类型分布9由于人工智能赛事涉及的赛道非常广泛,除了计算机相关的专业外,还可能需要材料科学、电气工程、自动化工程
33、、通信工程、数学等学科的专业知识,甚至还有部分赛道需要航天工程、测绘与地理、物理学、医学、人文与社会科学等与计算机科学不太相关的学科背景。对于拥有多领域人才的高校和科研机构而言,涉及到多领域的人工智能赛事对于不同学科的交流以及交叉学科融合研究与教学都有极大的促进作用。表 3-1 人工智能竞赛对高校的价值总结人工智能竞赛的亮点价值理论学习与演练实践相结合加强学生锻炼实效,检验人才培育效果优化教学和人才培养方式接触到更真实、更优质、更具时效性的产业数据展示高校的学科资源和教学成果树立重视学科建设与人才培养的形象探索如何将理论知识转化为实践应用打造学科建设的标杆案例实践学习数据资源高校形象学科建设数
34、据来源:和鲸科技()经调研统计得出。引用请注明出处。二、推动科研机构加速产研融合与技术发展推动科研机构加速产研融合与技术发展科研机构是技术研究与探索的引领者,也是数字化转型的推动者。基础研究、应用研究和开发研究是科研系统中三个紧密相连的重要环节,三者协调统一的发展才能够真正实现科研成果的价值转化。在人工智能领域,人工智能竞赛为这个过程的进化创造了条件,集中了数据、人才等必要的基础要素,提供了跨学科领域的交流环境。同时,前沿科研的实用价值通过竞赛被释放、被感知,也获得了持续的社会关注和资源支持。科研机构的赛题技术方向和应用场景富有前瞻性,集中于和自身行业背景属性相同的场景中,地质、水利、气象、传
35、媒是较为常见的赛题场景。基础研究:为技术发明创造理论前提的 应用研究:在理论基础上针对特定目标进行研究 开发研究:将基础研究和应用研究成果投入生产实践表 3-2 人工智能竞赛对科研机构的价值总结人工智能竞赛的亮点价值融合丰富的资源支持开辟创新的科研价值探索路径释放前沿科研的实用价值树立起前沿科研成果创新应用探索的标杆与工业界进行紧密合作促进了跨学科领域产研交流前沿科研进展科研标杆产研交流数据来源:和鲸科技()经调研统计得出。引用请注明出处。人工智能竞赛帮助促进高校的学科交叉与产研融合 19人工智能竞赛帮助促进高校的学科交叉与产研融合 20数据来源:和鲸科技()经调研统计得出。引用请注明出处。图
36、 3-2 科研机构类赛事主办方的赛题场景分布和技术类型分布77第四章选手眼中的人工智能竞赛一、为什么参加人工智能竞赛二、希望通过参赛收获三、认为竞赛对自己的意义选手眼中的人工智能竞赛 22一、为什么参加人工智能竞赛竞赛离不开人才的参与,那么人工智能竞赛对于参赛选手有哪些价值,他们参与竞赛的动机和意愿是又什么?通过面向逾千名选手的调研中发现,选手报名参与竞赛的动机主要有如下几方面:1.实战经验:参与竞赛可以接触业界实际的业务场景与真实数据,助力人才累积相关技术在具体行业场景下的应用经验。2.技能提升:竞赛过程中能极大锻炼工程实践,复杂分析,团队协作等能力,培养技术与跨领域认知策略,提升人才综合素
37、质。3.交流学习:由具体的赛题和充满探讨交流氛围的竞赛学习环境,助力人才拓展人脉,建构知识与人际关系的连接。4.报酬奖励:一般竞赛都有不菲的赛事奖金和并提供工作机会,在人工智能竞赛中取得的成绩也日益成为证明个人能力的权威背书,对促进人才职业发展与财富积累颇有裨益。图 4-1 调研对象对于各项人工智能竞赛收获诉求的重要性评价数据来源:和鲸科技()经调研统计得出。引用请注明出处。05001000150020002500二、希望通过参赛收获根据在人工智能竞赛中的排名表现,调研对象被划分了黄金玩家、白银玩家和青铜玩家三大类。大家对人工智能竞赛的诉求在呈现出一定程度上的一致性之外,也在某些具体内容上有细
38、微的差异:黄金玩家依然把赛事奖金列为最大诉求,也远比其他人更加倚重通过竞赛拓展人脉和加强交流学习;相对入门的青铜玩家则更加看重能通过竞赛接触数据和获取工作机会。图 4-2 不同水平调研对象对于各项人工智能竞赛收获诉求的重要性评价数据来源:和鲸科技()经调研统计得出。引用请注明出处。选手眼中的人工智能竞赛 23选手眼中的人工智能竞赛 24三、认为竞赛对自己的意义人工智能竞赛有重要意义和丰富价值,吸引着越来越多的人才投身人工智能竞赛,为更好的了解人工智能竞赛对于参赛者的意义?我们设计了自我效能感、内部满足感、外在报酬感等维度去探究选手们眼中人工智能竞赛对于他们的意义。量表指标量表维度自我效能感即使
39、竞赛再困难,我也能努力创新去解决我如果努力去做,能够在竞赛中取得好名次参与竞赛是我的兴趣,很享受竞赛的过程竞赛排名前列,让我很有成就感我有所需的专业技能去完成竞赛竞赛给我一个机会去做我擅长的事我有机会通过参与竞赛交流学习知识我能比参与竞赛的其他人提供更有价值的方案我喜欢竞赛的整体氛围竞赛对应的物质奖励对我很有吸引力竞赛能够有助于我发展事业的机会竞赛可以增强我在就业市场的竞争力内部满足感外部报酬感1.自我效能感2.内部满足感自我效能感是个体结合自身的实力和任务难度,对于完成任务目标的自信程度。故在参与人工智能竞赛的人才中,其自我效能感会随着持续参与的结果不断进行调整。具有高水平自我效能感的选手,
40、在竞赛中更可能相信付出努力,可以获得满意的绩效,也即高自我效能感的人才容易形成较高的期望估值并持续的付出和留存。内部满足感不是为了一些可感知可分离的结果做事,而是满足内心的需求。拥有诸如乐趣、挑战感、归属感等内部动机的使用者更能够持续参与和使用。本年鉴中持续参与动机中的内部满足感动机分为学习成长、身份构建、虚拟社区感三个方面。(1)学习成长学习成长是指人才在参与人工智能竞赛中,能够学习或提高的相关技能,继而能力提高会引发参与者的持续根据深度访谈选手反馈,人工智能竞赛是锻炼技能实践验证能力的机会,在学习与就业的不同阶段都会参与竞赛去不断提升自己的能力,培养自我效能最大的困难是刚接触竞赛时,知识储
41、备不足,缺少相应的路径和指导。相比竞赛中名列前茅,更看重在竞赛中多次累积的经验,底层的数据分析能力训练与跨领域认知策略的培养,更让自己有信心并不断参与竞赛。与意向,当个体在参与的过程中得到学习和提升,也容易被社群接纳建立归属感,也就会更频繁的参与。(2)身份构建身份构建是指通过在竞赛中,释放自己的创造力和想象力,来证明自己能力并进一步构建自己的身份角色,也称自我肯定。身份构建和自我肯定能够使得竞赛选手产生沉浸的体验,保持持续的参与意愿和行为。选手希望通过持续的参与赛和任务,能够证明自己的能力并且构建自己的身份。(3)虚拟社区感虚拟社区感会使其对社区负有责任感,从而在竞赛平台中想要持续的参与。竞
42、赛选手在社区中互相支持建立自己的角色并且认同别人的身份以及产生信任,会产生社区归属感,进而有持续参与的意愿。根据深度访谈选手反馈,在人工智能竞赛中和志同道合的小伙伴一同参与竞赛,通过学习成长,从竞赛小白一路成长为竞赛大神,通过社交不断深化关系链,并在社群与社区中渐渐构建起影响力和社会地位,对于自己很有满足感和社区归属感,愿意分享自己的竞赛经验,自发维护竞赛氛围,愿意为人工智能竞赛生态建设不断贡献力量。3.外部报酬外部报酬能够间接地得到内心满足的需求,是一种可感知可分离的事务,例如竞赛奖金,工作机会等,越高的奖励的设置,越能增强持续参与意愿。人工智能竞赛平台具备将知识进行变现的有偿属性,人才对于
43、获取报酬的预期是激励和吸引他们参与的十分重要的因素。根据深度访谈选手反馈,人工智能竞赛比起奖金更看重的是工作/实习机会,人工智能竞赛带来的就业竞争力的提升,和工作机会要比一次性的奖金更为吸引人,一次完整参与竞赛的项目经历可以为简历增添不少分数,获取 Top 名次就更有竞争优势,目前也有不少公司或机构通过人工智能竞赛遴选人才,在如今数字经济时代,算法相关岗位竞争相对激烈,人才通过人工智能竞赛获取更多报酬机会,具备相应的意愿,但因为竞赛的名次有限,竞争依旧激烈,故意愿相对自我效能感与内部满足感低一些。人才是人工智能竞赛的核心源泉,竞赛的价值体现与人才内在的动机满足相互促进,共同发展。随着时代的发展
44、,面对社会对人工智能人才的泛在需求,人才应跟紧技术发展与产业升级的步伐,意识到人工智能竞赛对于个人成长与发展的价值,广泛积极参与竞赛,不断夯实基础知识,积极学习跨学科、多领域技能,以解决实际问题为导向,持续积累项目经验,全方位提高综合素质能力。选手眼中的人工智能竞赛 25第五章组织人工智能竞赛的挑战一、对竞赛复杂性的调研结果二、人工智能竞赛的运营复杂度详解一、对竞赛复杂性的调研结果调研发现,在多数的参赛选手心目中,人工智能竞赛的质量取决于三个要素:主办方的品牌知名度、赛事激励的丰厚程度、竞赛是否提供真实的数据。这些是吸引优质参赛选手,促进产出更高水平成果的关键要素。但是,这三点仍不足以保障优质
45、竞赛的完成。人工智能竞赛牵扯1.主办方对竞赛有高预期到应用场景、数据、算力、算法和人才等方方面面的复杂要素,包含了数据科学研发过程中的主要环节,从赛前筹备到赛中运营,再到赛后跟进,从应用场景挖掘到配套数据处理,从计算环境搭建到算法应用,从参赛选手管理到成果测评,每个环节都需要专业能力和精细运营的支撑。2018 Kinetics 视频行为分类比赛数据失误导致重大竞赛事故2018 年,Kinetics 视频行为分类比赛遭遇了赛事组织的多次事故。起因在于赛事运营方发布的训练集数据中错误地混入了测试集数据。一周后,赛事运营方重新发布的数据集再度出现重大疏忽所有数据标签被泄漏,意味着能够验证模型效果的答
46、案遭到提前揭示,选手无须花费精力训练可靠的模型。参赛选手向赛事运营方发送邮件反应数据集的问题,也未得到及时的回应和解决。赛事的公平性和参赛团队的积极性遭到了破坏,同时引起了舆论争议,赛事被迫延期。不同的赛事主办方举办人工智能竞赛的初衷各有侧重,其共同的诉求是赛事进程平稳顺畅、舆论评价正面积极、参赛选手能够准确理解赛题、参赛选手技术能力出色、赛事成果具有优越表现。这需要不同环节的专业服务能力紧密配合,促成赛事实现最好的效果。正是意识到赛事筹办和组织的复杂性,主办方存在多方面的顾虑,担心对于人工智能竞赛的投入无法获取预期回报,甚至损伤品牌形象。人工智能竞赛还是需要依赖专业的办赛平台,因为人工智能竞
47、赛筹办区别于普通的活动组织,企业缺乏专业的的赛事运营人员和赛题设计人员。上海电信 互联网部产品技术研发中心副经理 葛正荣术业有专攻,优秀的企业更懂得互补+合作=共赢的价值。同盾除了不断锻造自身技术实力外,也积极推行在产学研领域的企业价值,创办专业的赛事、选拔潜在的专业科技人才,这需要专业的赛事平台参与其中,从学术性与商业性相融合的赛题设计、到赛制中的数据质量与敏感把控,以及兼顾数据安全与赛题可解性,都需要更加专业的、垂直的竞赛平台来合作共建。同时,专业的竞赛平台拥有过硬的技术实力,可以勘验参赛选手的成果。在整个赛事的宣传节奏把控上,也能够创造出丰富的内容及足够触达到目标群体的有效渠道。同盾大学
48、运营人员 娜娜组织人工智能竞赛的挑战 27组织人工智能竞赛的挑战 28从参赛频率的维度来看:竞赛新手:关心自己是否值得将精力投入到竞赛中,获得经验与成长,认为优质的人工智能竞赛首先应该具备科学合理的赛题、数据和测评办法,竞赛页面的文字描述需要清晰、专业、合理。竞赛常客:在赛题与数据相匹配的基准要求被满足后,则更关心完善的赛制、自动测评等功能点能够保障良好的参赛体验。竞赛老手:奖金或工作机会等实质性激励是他们首要考虑因素,且激励也需要以合理、可解的赛题为基础;此外,他们也会倾向于投入精力加入前沿性难题的探索。图 5-1 不同参赛频率的调研对象判断人工智能竞赛是否优质的考虑因素排序数据来源:和鲸科
49、技()经调研统计得出。引用请注明出处。16.015.014.013.012.011.010.09.08.07.06.05.04.03.02.01.016.013.012.015.010.09.014.08.04.05.02.011.03.01.07.06.011.014.01.013.07.05.015.012.03.07.010.08.09.06.02.04.02.参赛者对竞赛有严要求选手的技术潜力的释放程度和技术能力的发挥水平,高度依赖于赛事全生命周期的技术支撑和运营管理。人工智能竞赛参赛者调研的结果显示:组织“优质的人工智能竞赛”需要兼备专业的技术储备和丰富的项目管理经验。图 5-2 不
50、同参赛频率的调研对象认为影响人工智能竞赛质量最重要的因素数据来源:和鲸科技()经调研统计得出。引用请注明出处。从参赛成绩的维度来看:青铜玩家:除了要求题意表达通畅清晰外,希望公平的赛制和完善的测评功能能够保障竞赛的锻炼价值。白银玩家:最关心赛题与数据匹配程度;进而关心有科学的测评算法合理评估选手的表现;而为了更有效率地展现实力,白银玩家也要求优质的人工智能竞赛配套功能全面、性能优越的算法开发工具和计算资源。黄金玩家:对自己的能力充满自信,因此对于优质人工智能竞赛的定义简单直接:不浪费时间、不枉费付出,即赛题、数据、评审办法科学合理,且有敏捷完善的产品功能予以支撑,从而保证其精力最大程度投入解题