1、2019年安徽省大数据与人工智能应用竞赛赛项规程一、竞赛名称项目名称:安徽省大数据与人工智能应用竞赛英文名称:Anhui Big Data and Artificial Intelligence Application Competition二、竞赛组织机构主办单位:安徽省教育厅承办单位:安徽工业经济职业技术学院、合肥工业大学、合肥学院(一)组织委员会主 任:储常连 安徽省教育厅副厅长执行主任:梁 樑 合肥工业大学校长副主任:梁祥君 安徽省教育厅高教处处长陈小军 安徽工业经济职业技术学院校长委 员:黄景荣 合肥工业大学教务部副部长、创新创业教育中心主任胡学钢 教育部大学计算机类专业教学指导委员
2、会委员刘沛平 合肥学院创新创业中心主任佘 东 安徽工业经济职业技术学院 计算机与艺术学院院长(二)专家委员会主 任:王 浩 教育部大学计算机课程教学指导委员会委员 合肥工业大学教授委 员:朴松昊 哈尔滨工业大学教授韩江洪 合肥工业大学教授岳丽华 中国科学技术大学教授郑利平 合肥工业大学教授张润梅 安徽建筑大学教授孟 浩 安徽农业大学教授钟秋波 宁波工程学院教授高先和 合肥学院教授(三)仲裁委员会主 任: 郑 诚 安徽大学副教授委 员:候整风 合肥工业大学教授郭玉堂 合肥师范学院教授付建民 安徽工业经济职业技术学院教授刘 力 安徽财贸职业学院教授陈 蕴 安徽建筑大学教授(四)秘书处秘书长:胡学钢
3、 教育部计算机类专业教学指导委员会委员 合肥工业大学教授副秘书长:徐 慧 合肥工业大学创新创业教育中心副主任秘书处办公室设在合肥工业大学计算机与信息学院三、比赛目的在安徽省教育厅的领导下,本竞赛致力于推动安徽省各高校大数据与人工智能相关专业的建设,培养安徽省大学生大数据与人工智能技能、数据科学思维、实践能力和协作能力,提高大学生的大数据与人工智能的创新创业能力,以适应大数据与人工智能技术应用领域快速增长的人才需求。四、竞赛内容(一)竞赛内容本次竞赛分为“本科组”和“高职组”。本科组竞赛内容分为大数据平台部署、大数据预处理、大数据分析、大数据可视化以及综合应用等;高职组竞赛内容分为大数据平台搭建
4、、运维与优化、语言代码处理、大数据工具使用、大数据处理及分析、文档编写等。(二)竞赛方案参赛选手首先在指定的时间内参加网络赛(资格赛),通过直接在网上做题的形式进行比赛,通过资格赛的队伍方可进入现场赛。现场赛时每队拥有三台计算机,参赛队根据题目要求完成竞赛内容,最后裁判根据各队的答题情况和评分标准进行判分决定其成绩。五、竞赛方式本次竞赛采用网络赛+现场赛的形式。六、竞赛流程2018年12月,召开技术委员会(由专家组遴选,组委会认定)会议对比赛内容及形式进行遴选并确认。2019年7月召开竞赛规则研讨和赛前教练会,并在比赛官方网站上进行报名。2019年8月举行网络赛,2019年10月12-13日举
5、行现场赛。七、比赛赛题本次竞赛分为“本科组”和“高职组”。 本科组竞赛内容分为大数据平台部署、大数据预处理、大数据分析、大数据可视化以及综合应用,具体包括:大数据平台部署:参赛选手根据题目要求完成大数据平台的部署,包括但不限于Hadoop、HDFS、HBase、Hive、Spark、Zookeeper、SQOOP等,并能够根据要求对部署的平台参数进行调整以及测试平台可用性。大数据预处理:参赛选手根据题目要求对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换。大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上进行数据的
6、分析。大数据可视化:参赛选手根据题目要求对给定数据进行可视化展示,并能对可视化结果进行解释说明。综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。高职组竞赛内容分为大数据平台搭建、运维与优化、语言代码处理、大数据工具使用、大数据处理及分析、文档编写,具体包括:大数据平台搭建、运维与优化:在试验机部署Hadoop、SPARK集群;实现HIVE,Hbase数据库部署,并实现数据存储;实现其他大数据组件部署,并实现相关功能。编程及大数据工具使用:使用python、java语言实现数据爬取(数据抽取)、数据字段梳理、数据去重、数据统计分析;使用数据分析
7、工具实现数据抽取、数据字段梳理、数据去重、数据统计分析;大数据处理及分析:根据竞赛题目,实现数据源获取(数据清洗、数据统计、数据挖掘、数据展现;利用 提供的D3.js、Echarts、大数据BI分析工具、python相关图形库等方式进行多种方式的可视化展现。文档编写:编写数据分析方法文档和数据分析结果文档。八、竞赛规则(1)报名资格和要求比赛以队为参赛基础,每支参赛队由1-3名参赛学生(队员)和1-2名指导教师(教练)组成。参赛学校可另设领队1名(可由指导教师兼任)。领队和教练必须是参赛学校的在职教师,本科组参赛队员必须是当年度参赛学校的在读本科生、研究生,高职组参赛队员必须是当年度参赛学校的
8、专科生。为保证竞赛公平公正,竞赛组委会、专家委员会、仲裁委员会成员,竞赛相关工作人员不得作为参赛指导教师。参赛学校教师作为第一指导教师参加项目(队伍)数不得多于2项。参赛队员是否符合本规则关于学历的规定,由竞赛组委会负责解释,由此产生的任何疑问应提交仲裁与监督委员会审议。参赛学校必须提前通过竞赛组委会指定的网络报名系统向组委会报名注册,并在现场报到时提交由参赛学院及以上部门盖章的参赛承诺书,不接受个人报名。(2)赛前准备赛前开展比赛规则研讨,并对比赛规则进行进一步解读。各参赛队伍师生依据比赛规则和要求进行比赛准备。(3)比赛期间参赛队必须在指定的位置就坐和操作指定的计算机。参赛队员可以携带诸如
9、书、手册、程序清单等参考资料。参赛队员不能携带任何可用计算机处理的软件或数据(不允许任何私人携带的U盘、磁盘或计算器)。参赛队员不能携带任何类型的通讯工具,包括无线电接收器、移动电话。在竞赛中,参赛队员根据题目要求完成相关工作,参赛队员不得和竞赛组委会指定工作人员以外的人员交谈,现场工作人员只能回答和处理与平台系统相关的问题。参赛队员出现妨碍比赛正常进行的行为,诸如擅自移动赛场中的设备,未经授权修改比赛软硬件,干扰他人比赛等,取消其参赛资格。竞赛的预定时间为4小时,但当竞赛进行一定时间后,竞赛专家组可以因为出现不可预见的事件而调整比赛时间长度,一旦比赛时间长度发生改变,将会以及时并且统一的方式
10、通告所有参赛队员。(4)成绩公布竞赛结束后,由竞赛评测专家(由专家组遴选,组委会认定)进行评测, 最终成绩将在大赛官网进行公示。公示无异议后,上报安徽省教育厅高等教育处,并在安徽省高教网再次进行公示。待公示期满后,由安徽省教育厅发文公布获奖名单。九、竞赛地点和环境现场赛地点定于安徽工业经济职业技术学院机房参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台,竞赛用电脑由竞赛组委会统一提供。操作系统:Centos编程语言:Python、Java。Python语言开发环境采用PyCharm,Java语言开发环境采用Eclipse。十、成绩评定大数据与人工智能应用类(本科组)评分标准如下:竞赛内容竞
11、赛考核要求成绩占比大数据平台部署根据要求完成大数据平台的部署,并能够对部署的平台参数进行调整以及测试平台可用性15%大数据预处理对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换30%大数据分析在已搭建好的大数据平台上进行数据的分析20%大数据可视化对给定数据进行可视化展示,并能对可视化结果进行解释说明15%综合题对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题20%大数据与人工智能应用类(高职组)评分标准如下:竞赛模块竞赛考核内容成绩占比大数据平台搭建与运维搭建分布式hadoop平
12、台,hdfs,hbase,hive,spark模块,并测试可用性,对参数进行调整,实现优化目标;对提供的文件和部分数据,采用相关hadoop和spark命令和算法包,进行处理;hdfs,hadoop计算包,sqoop命令转换,hbase相关数据查询和处理,hive数据查询和处理,spark计算语法和处理30%编程对比赛数据进行爬取,去重,清洗,统计(对提供样本目标进行爬取,去重,清洗和统计);对提供的样本数据进行排序,二次排序,平均值,分类统计计数,join联接,倒排索引等基本算法分析,并完成其他要求的统计分析;从基础数据开始自行设计完成一个完整的项目分析过程30%数据可视化根据环境提供的通用
13、python图形库,echart库,d3.js库,BI工具等实现如下内容:数据静态分析可视化:利用提供平台对数据进行静态分析得到相应的分析结果,并进行数据呈现的解释数据动态展示可视化:利用提供的平台和框架进行可选择动态变化数据源的动态展示,或者实时图形分析展示自由可视化题:提供一个已完成的数据,重点综合利用可视化的设计学只是,选择怎样的可视化,更加直观和可行,并进行分析30%数据分析文档编写将比赛中涉及到的要求的分析部分,按照合理的方式对分析方法,分析流程和分析结果进行适当的分析。10%十一、奖项设定本次竞赛以有效参赛队伍的数量为基数,按参赛队成绩排序,分别设置一等奖(不超过基数10%)、二等
14、奖(不超过基数20%)、三等奖(不超过基数30%)。十二、赛项安全(1)比赛环境竞赛场地(含机房、体育馆、多媒体教室等)用电应报备学校后勤管理部门,赛前会针对竞赛场地电线路进行检查,充分保障场地用电安全。同时配备后勤管理机动人员1名,用于竞赛过程现场用电安全维护。(2)生活条件竞赛队员在各校指导老师带领下入住学校附近宾馆或由组委会指定宾馆。交通食宿费用由各参赛队伍自行承担。(3)组队责任参赛院校必须安排一名领队负责参会师生的人身安全,并为参赛师生购买人身保险。各校指导老师应充分保证学生交通、食宿安全,指导学生训练,引导学生以正确的心态参加竞赛,营造良好的参赛氛围。(4)应急处理比赛期间赛场设备
15、若发生技术故障或其他紧急情况,发现者应第一时间报告赛项组委会,同时采取措施避免事态扩大。赛项技术委员会应立即启动预案予以解决并上报大赛组委会。赛项出现重大安全问题可以停赛,是否停赛由赛项组委会决定。事后,赛项技术委员会应向大赛组委会和专家组报告详细情况。超过400人以上的赛事现场应安排1-2名医务人员,可以完成相关急救工作。(5)处罚措施竞赛期间对于不能严格执行竞赛规则,违反竞赛规定的参赛队员取消及参赛资格及成绩,并禁止参加下一年度的比赛。十三、竞赛须知(1)参赛队伍、参赛指导教师、领队须知各参赛队需凭参赛证件进入比赛现场;各参赛队在现场注册时需要提交学校教务部门或院系以上单位的推荐意见(需签
16、章);参赛学校领队对报名资料的真实性和参赛指导老师、学生排序负责。指导教师熟悉竞赛规程,为参赛队伍提供指导;指导教师及领队贯彻执行大赛各项规定,竞赛期间不私自接触裁判;领队负责做好本参赛学校大赛期间的管理工作,负责本校的参赛组织和与大赛的联络,准时参加赛前领队会议,并认真传达落实会议精神,确保参赛选手准时参加各项比赛及活动;领队在比赛时需密切留意参赛选手的比赛时间,安排充足人员进行调度,避免出现因迟到而被取消比赛资格的现象;领队应负责赛事活动期间本队所有选手的人身及财产安全,如发现意外事故,应及时向组委会报告;只有领队才有权向仲裁委员会提出仲裁请求。(2)参赛选手须知各参赛选手凭大赛组委会颁发
17、的参赛证和有效身份证件参加比赛及相关活动。参赛选手应自觉遵守赛场纪律,服从裁判、听从指挥。(3)工作人员和志愿者须知必须服从组委会统一指挥,认真履行职责,做好比赛服务工作;要按照分工准时到岗,尽职尽责做好分内各项工作,保证大赛顺利进行;真检查、核准证件,非参赛选手不准进入赛场。同时,要协调好领队、指导教师休息及食宿;比赛出现技术问题(包括设备、器材)时,应及时与比赛负责人联系,及时处理;如遇突发事件,及时向组委会报告,同时做好疏导工作,避免重大事故发生,确保大赛圆满成功;要认真组织好参赛选手的赛前准备工作,遇到重大问题及时与组委会联系,协商解决办法。十四、申诉与仲裁参赛队对比赛结果有异议,可以
18、由参赛学校领队向组委会提出书面仲裁请求,需要参赛队员、领队和教练的签名。组委会和专家组委托裁判根据比赛规则给出针对申诉内容的裁决依据,仲裁请求和裁决依据2份材料一起提交仲裁委员会。仲裁委员会依据比赛规范、规则以及裁判给出的裁决依据对比赛结果进行仲裁,仲裁结果为最终结果。十五、其他本次竞赛的相关联系信息如下:(1)联系人本科组联系人吕俊伟(181-5630-0268)lvjw_hfut高职组联系人朱晓彦(134-8570-1120)47731950赛事赛务联系人杨兴明(139-6666-9525)xmyang168(2)竞赛官网地址(3)竞赛交流QQ群大数据与人工智能应用类(本科组)竞赛QQ群号:702551705大数据与人工智能应用类(高职组)竞赛QQ群号:318962514各参赛学校可指派1-2指导教师加入。 12