1、勤智创新创业大数据平台处理方案成全部勤智数码科技股份6月目录1建设大数据平台的目的32大数据平台带来的价值33投资建设的内容43.1大数据支撑体系建设53.1.1大数据支撑平台53.1.2数据管理子系统103.1.3创新创业管理子系统133.1.4数据统一展示门户子系统143.1.5用户及权限管理子系统173.2大数据平台运营维护服务193.2.1平台内部资源的监控管理193.2.2平台故障处理管理203.2.3日常平台管理任务自动化213.2.4故障处理自动化213.3科研专家和数据资源224项目收费和收益模型224.1平台运营服务224.2数据运营服务收益234.3大数据产业链发展促进收益
2、234.4政府社会收益235项目建设阶段目标241 建设大数据平台目标大数据正在改变信息社会,我们正从IT时代走向DT时代。大数据产业,作为国家战略新兴产业,受到各级政府高度重视。大数据产业建设,经过“政府引导、市场主导”模式建设一个数据驱动创新创业生态环境,改变当下政务数据分散、独立现实状况,充足利用“大众创业、万众创新”创新创业热潮,主动建设一个以数据驱动运行体系、创新创业生态、大数据产业链、政务数据共享交换、智慧城市大数据支撑平台为关键目标大数据全产业链生态环境。以“一点创新,全盘激活”为引导思绪,“一平台,多应用”为框架设计思绪,在人才培育体系建立、就业岗位增加、产业发展空间和产值提升
3、等方面真切做到为政府提供全方位服务,从而为产业发展现实状况形成标杆性发展格局,扎实大数据产业发展基础。深入推进“大众创业、万众创新”,让创业创新成为经济增加“倍增器”、发展方法“转换器”, 让“大众创业、万众创新”在全社会蔚然成风;支撑政府在更高平台上实现经济可连续发展,为产业转型升级提供经验和启示。2 大数据平台带来价值创新创业大数据平台能够带来巨大产业发展空间、处理很多历史问题、明确城市产业发展方向和带动相关产业协同发展,具体表现在:数据运行体系建立:建立以数据为关键资产和驱动力运行体系,全方面利用智慧城市框架内各类垂直业务运行数据、国信优易拥有可访问700T国家部分部委政务数据、区域政府
4、各委办局政务数据等高价值数据资产,并为之配套形成标杆性规范和标准,对于大数据产业发展方向无疑会产生标志性里程碑意义。依靠国信优易未来国家级大数据共享促进中心发展定位,创新创业大数据平台作为区域内唯一国信优易所拥有国家部委关键数据资源访问接口,在未来以数据驱动运行体系中会处于很有利发展格局。创新创业生态孵化:以数据为基础创新创业平台,不仅迎合了国家“大众创业、万众创新”政策,能够为政府服务,产生很多就业机会,形成有效汇聚人才、吸引投资强大磁场。数据作为政府关键资产,有数据就有机遇,就会有些人才培养和孵化润土。大数据产业链打造:结合大数据产业发展目标,充足利用创新创业大数据平台中拥有高价值智慧城市
5、运行数据、国信优易数据、政务数居等关键资源,打造以数据为关键产业链:产业链上游为各类数据拥有者和数据制造者;产业链中游为多种数据加工、创新创业、数据使用者,让数据成为产业链“石油”资源,驱动产业链良性发展;产业链下游为政府或社会企业对数据加工创新步骤产生各类落地应用和商业模式进行投资和运行;经过大数据产业链良性循环,为政府带来百亿等级产业发展机遇和上亿产值。智慧城市数据互联支撑:智慧城市发展计划顶层设计会包含到很多底层数据和上层应用,将各类垂直应用运行数据接入到统一智慧城市数据支撑平台中,能够为未来智慧城市建设产生数据互联互通提供基础支撑,为数据运行体系提供充足血液。政务数据共享交换:经过对各
6、个委办局数据孤岛中各类数据分类、数据目录定义、数据挖局、数据分析、数据清理、数据脱敏、数据水印、权限管控、数据热度模型等各类数据生产加工,为上层基于数据共享创新等应用提供足够数据支撑;同时政府也可充足利用民生数据,脱敏利用后最大程度做到服务于民。成全部勤智数码科技股份(以下简称“勤智数码”)成立于,管理团体均来自世界五百强,含有丰富资本运作、市场运行经验,依靠和电子科技大学成立“机器学习和数据智能”联合试验室,在大数据平台、数据分析和算法融合、应用开发等领域有丰富项目经验和实力,成功承接过数十个政府大型项目标建设,运行和运维工作。勤智数码期望借助当地化企业优势,负担创新创业大数据平台项目建设及
7、后期运行工作,组建最优异教授团体,在顶层设计、建设和运行工作等方面高质量、按计划完成。3 投资建设内容创新创业大数据平台项目标投资建设,因为包含软硬件资源、咨询沟通、信息数据等内容繁多,勤智数码结合政府相关项目经验,对初步提议投资模式进行了以下归纳总结。创新创业大数据平台项目关键包含到三个方面投资建设内容,包含:1)大数据支撑体系建设2)大数据平台运行维护服务3)科研教授和数据资源服务投入具体投资建设内容以下:3.1 大数据支撑体系建设为了实现政务数据共享创新体系建立,对政务数据需要有完备分析处理体系,以支撑整个创新创业生态、大数据产业链健康发展,而且国信优易拥有高质量国家部委各类数据,为了能
8、有效访问到经过国信优易授权各类数据,建设内容已经充足考虑应用中国现在成熟和优异技术,最大程度复用国信优易大数据平台成熟稳定技术架构和实现,结合特定需求元数据管理、数据分类、数据审计、数据审核、数据评定、数据定级、数据公布、数据水印管理、数据开放接口管理、数据展示统一门户系统、身份权限管理、用户管理、平台门户系统、其它接口和应用平台等符合当地实际情况定制开发等建设内容。大数据支撑体系是整个创新创业大数据平台项目标关键支撑,也是投资建设难度最大一个投资建设任务之一。包含:3.1.1 大数据支撑平台创新创业大数据平台负担了智慧城市底层支撑、政务数据共享交换、互联网数据存放、国信优易数据访问接口等多个
9、关键业务需求,平台本身需要含有和采取优异经过深度优化大数据技术、分布式存放计算和算法模型、高并发和快速响应高速缓存架构等,建设一个基于SOA框架大数据能力关键平台,作为整个项目标数据智慧处理中心,需要支持多个数据源聚集 (政务数据、互联网数据、行业数据等),支持不一样数据格式(结构化数据、非结构化数据和流数据等)。在繁杂数据接入要求情况下,采取基于总线机制数据接入系统,能够快速有效完成数据接入要求和提供丰富和灵活扩展性。大数据支撑平台建设计划采取复用国信优易成熟大数据平台产品思绪,一是确保了和国信优易数据接口访问互通一致性、二是成熟产品架构确保了运行稳定性、技术优异性。平台总体逻辑架构分为三层
10、:基础设施层(IaaS层)、大数据平台层(PaaS层),和大数据应用层(SaaS层)。基础设施层依靠于分布式存放架构,大数据平台层则提供了包含数据接入、分析、共享和平台管理在内大数据分析处理功效,最终由大数据应用层提供多种大数据应用来充足展示大数据平台数据处理能力和共享能力。图:创新创业大数据平台逻辑架构设计3.1.1.1 基础设施支撑平台IaaS政务大数据平台将充足利用区域政务中心(或信息中心)提供基础设施资源,如:计算、存放、备份、网络和安全防护等,从而为政务大数据平台提供一个稳定可靠、高性能、扩展性强、易于管理基础设施平台,IaaS层中基础服务器和网络等资源计划尽可能复用现有硬件资源。3
11、.1.1.2 大数据分析处理平台PaaS政务大数据平台利用数据接入服务,将在云计算中心布署政务应用中存在政务信息资源和互联网数据进行统一接入,经过对结构化和非结构化数据进行处理后,汇总形成总计21个一级类,133个二级类政务大数据目录库,实现资源查询、检索和共享利用。同时,构建高效大数据分析系统,利用分布式数据处理、分析工具和展示工具,为上层应用服务提供大数据处理和分析能力。另外,利用大数据门户,为政府各委办局、社会公众、社会应用开发商提供资源查询、信息公开和数据服务。3.1.1.3 大数据经典示范应用层SaaS利用基础设施支撑平台和分析处理平台构建基础云端应用服务能力,建设数据创新创业促进系
12、统、数据创新竞赛等提云端应用服务,在平台落地建设完成时,即可提供具体应用提升人气,产生数据价值。3.1.1.4 标准和优异平台大数据平台计划设计完全符合国家宏观政策和各类标准,在标准规范层面,经过建立政务大数据平台数据目录编制规范、数据权限管理规范、运行标准规范、平台安全和运维标准规范、数据交换接口规范,为平台运行、维护和安全级权限控制管理等方面提供标准规范依据。大数据平台关键技术优势显著,以整体高可用性、灵活可扩展性、技术优异性为标准,打造适合于政府大数据产业发展支撑平台:q 双总线技术SOA框架: 平台层采取基于政务服务总线(GSB)及政务数据总线(GDB)双总线架构SOA框架。GDB关键
13、负责数据接入和交换,GSB关键负责对内对外提供统一服务接口。q 深度优化分布式异构存放技术: 平台使用了经过深度优化HDFS、HBase和集群关系数据库相结合异构存放方案,利用基于内存交换技术高速缓存和高性能数据中间件实现了高并发异构存放体系。q 自主知识产权高效算法和分布式计算框架:平台内部集成了几十种自主知识产权经过十多年技术沉淀算法集合,利用MapReduce和Spark高效分布式计算框架,实现各类复杂数据挖掘和分析需求。图:创新创业大数据平台功效层次架构设计3.1.1.5 互联网舆情信息模块据不完全统计,中国网民规模达6.32亿,互联网普及率为46.9%,网络已经成为超越广播、报纸、电
14、视第一大信息传输媒介。42%消费者拥有博客或个人空间。61.7%网民在购置之前到网络小区(如垂直网站、论坛、博客或问答)寻求推荐和提议。34%博主发表相关产品和品牌意见。73%消费者在网上交流见解。76%网民将网络口碑作为了解产品和服务最可靠信息源。78%消费者相信好友推荐。在选择商品和服务时,大家愈加关注她们在网络上排行。不到10%网民发表着超出80%原创言论,并吸引着超出90%点击率。依据权威媒体统计,69%政府和企业危机来自于互联网。对互联网信息接入将在信息资源规模上对大数据提供愈加丰富数据资源。本项目将对互联网门户网站、网络社交论坛、微博舆论信息等相关信息资源进行接入。q 互联网分布式
15、爬虫对互联网数据获取关键依靠于网络爬虫技术实现。创新创业大数据平台采取优异分布式网络爬虫框架,由框架完成爬虫统一调度、管理和维护工作,和被采集数据统一存放工作。爬虫使用者只需要进行简单配置或开发极少许脚本代码即可完成一个复杂页面甚至网站爬取工作。另外,平台在正当范围内合适利用反防爬虫技术,如验证码识别、动态IP、动态用户等,从而保障互联网数据有效获取,降低人工干预,节省成本。平台提供部分互联网门户网站、网络社交论坛、微博等系统爬虫,并采集对应数据以供平台使用。对于以后新增应用,假如需要用到其它网站数据,则能够基于爬虫框架,使用平台提供SDK套件开发对应爬虫。q 互联网门户网站信息获取接入互联网
16、门户网站信息获取接入是利用分布式网页爬取技术,和基于行业领域字库模式识别技术,实现对各类新闻门户网站、行业领域专业门户网站等相关B/S网页进行实时解析获取符合条件数据。互联网门户网站信息爬取对象以下: 对新华网、人民网、中国新闻网、新浪网、搜狐网、腾讯网、网易网、凤凰网、省级新闻网等各大综合类新闻网站实时监控,获取符合条件电子政务相关信息。 对中国气象网、中国地震台网、交通网、减灾网等行业领域门户网站实时监控,获取气象、地震、交通、自然灾难信息。 其它政府期望立即获取有价值互联网信息等。q 网络社交论坛信息获取和门户网站信息获取方法类似,网络社交论坛信息获取一样经过网页爬取技术获取互联网中社交
17、论坛信息。关键提供以下相关内容获取: 对天涯小区、猫扑小区、搜狐论坛、凤凰论坛、网易论坛、新浪论坛、凯迪小区、强国论坛、中华网论坛、新华网论坛、环球网论坛、红网论坛等众多主流论坛信息进行实时监控,获取符合条件电子政务相关信息。 对搜狗说吧、baidu贴吧等公共交流平台中信息进行监控,获取网民反应电子政务相关信息内容。q 微博信息获取微博信息获取关键经过调用爬虫对新浪微博网页爬取方法,对微博用户公布信息进行实时爬取,微博信息能够进行基础统计分析,为未来深层次利用做好准备。3.1.2 数据管理子系统3.1.2.1 元数据服务系统q 元数据库管理基于Web浏览器端,向后台系统管理员提供依据数据平台内
18、部元数据标准(数据描述元数据、服务信息元数据),分别进行对应元数据库创建和管理功效。q 元数据管理 基于Web浏览器端,向后台系统管理员提供对元数据文件导入功效。 基于单机版元数据编辑器,向后台系统管理员提供对数据描述元数据创建编辑保留功效。 提供基于元数据检索、元数据入库存放、元数据修改删除功效元数据管理WebService服务。q 元数据服务管理基于Web浏览器端,向后台系统管理员提供启停元数据服务功效。3.1.2.2 数据目录和接口标准管理系统大数据资源目录体系梳理包含对政务信息资源关键元数据标准、分类标准、标识编码标准等方面进行梳理。参考国家对政务信息资源分类体系制订标准,经过先期梳理
19、,可将政务大数据资源目录梳理为 21个一级类,133个二级类。代码目录名称描述和说明ZA综合政务相关政治方面事物和和国家管理工作ZAA政务综合类和政务管理相关综合性事务,包含政务督查、电子政务、信息公开ZAB方针政策政府制订、宏观、指导各个领域发展方针政策ZAD政府工作相关政府规章制度、组织机构建设和发展,和工作职责等相关信息ZAE机构编制相关机构编制管理、机构体系目前概况和远景计划ZAF政府领导相关政府各级领导简历、工作岗位、工作活动、讲话等相关信息ZAG会议、会务会议产生文件等相关信息,和会议组织、管理相关信息ZAH重大事件有深远影响事件相关信息ZB经济管理相关经济管理、计划、发展概况ZB
20、A经济管理综合类ZBB经济发展计划相关经济宏观发展计划ZBC经济管理相关经济宏观管理现实状况ZBD经济体制改革相关经济体制改革管理和计划、发展情况。ZBE经贸管理相关经济贸易宏观管理和发展调查汇报、统计资料ZBF统计相关统计工作管理和发展情况 (此处只列出部分分类, 整体依据国家标准进行同一分类)在平台建设同时结合符合国家标准平台段数据目录定义,结合各个委办局实际接口情况,明确各个委办局数据接口接入标准,明确可汇聚共享交换数据分类、数据格式、数据类型、数据接入方法等内容。经过明确接口标准定义,指导各个委办局数据接入,并提供必需技术支持和指导。数据目录定义和管理要遵照国家现有政务电子信息化建设相
21、关标准,同时结合各个委办局数据地域特殊性进行更细致完善,确保数据目录在遵照国家标准前提下,兼容支持当地政府各类数据。3.1.2.3 数据挖掘和分析系统数据分析模块子系统作为创新创业大数据平台对外提供数据深度挖掘和分析服务关键系统,分布式数据处理子系统提供了对分布式存放数据进行处理能力。数据分析系统利用多个分布式计算引擎,结合分布式数据存放模型对各类结构化及非结构化信息资源进行快速分布式分析处理,并将分析处理后中间结果数据提供给上层示范性应用和其它部门业务系统中进行二次利用;另外,模型管理子系统提供各类业务分析模型新建、修改等管理功效。创新创业大数据平台数据分析系统可分为以下多个关键部分:q 分
22、布式计算引擎支撑系统在分布式处理领域中,分布式并行技术是最为关键领域之一。没有好分布式处理程序支持,分布式处理就不可能很好工作,所谓超级计算、大数据分析也就愈加无从谈起了。创新创业大数据平台经过提供MapReduce、Spark和Storm三种分布式计算框架,为上层应用提供大数据分布式计算支撑。这种架构既能够最大程度满足多种业务模型需求,同时也能够充足利用政务大数据平台软硬件资源,提供数据存放访问及分布式计算任务调度、运行及结果通知等功效。q 算法及模型支撑系统数据分析不能一概而论,数据分析需要有基础算法支撑。伴随数据集规模和复杂度连续上升,对算法要求也越来越高。创新创业大数据平台采取基于Ha
23、doop技术架构处理技术,为数据分析师及开发者提供几十种含有自主知识产权分布式算法。平台提供对应SDK开发工具套件及算法调用API,从而让多种应用能够方便使用平台数据及其算法。拥有基础算法支持仅仅完成了数据分析和挖掘第一步,对于每一个具体基于数据应用系统,全部需要依据其本身特点建立对应分析模型,才能够有效支撑应用系统。简单说,分析模型能够看作是由一个或多个基础算法组合而成,基础算法提供了大量中间结果,而模型则将大量中间结果处理为最终止果。q 数据分析开发套件SDK大数据平台提供三种分布式计算框架为平台提供了强大分布式计算能力,从而为多种基于数据应用提供了基础运行环境;同时,基础算法库中大量分布
24、式算法实现则为数据分析模型建立提供了底层工具支撑。为了让平台计算能力和算法分析能力应用到实际业务之中,还需要经过研发人员开发出使用这些计算能力和算法库分析程序。分布式计算开发套件SDK则使平台含有了二次开发能力,它能够让研发人员利用大数据平台中分布式并行计算能力,经过基于数据分析定制开发,实现对海量大数据进行分析处理,建立数据分析处理结果性数据,为上层大数据业务应用提供数据支撑。3.1.2.4 数据信息管理系统q 数据审核数据审核模块关键是接收供给商门户网站上传流数据和块状数据,对这些数据进行审核,决定其是否能经过,并进入数据评定。q 数据评定数据评定模块关键是对已审核过数据,针对各个指标项进
25、行数值评定,最终保留其评定结果,供用户查询和数据定价时参考。q 数据定价数据定价模块关键是设置经过数据评定数据,对应不一样用户、不一样使用环境进行数据定价。q 数据公布管理数据公布管理模块关键是公布经过定价或评定数据,进行对外公布,设置其公布范围和公布状态。3.1.2.5 数据日志系统q 数据日志存放对外提供数据日志存放服务接口,供其它系统进行数据日志信息存放。q 数据日志查询基于Web浏览器端,向后台系统管理员提供数据日志查询功效。3.1.2.6 数据审计系统q 数据服务使用情况审计基于web浏览器端,向后台系统管理员提供对登陆和使用平台进行数据服务使用情况用户行为进行跟踪统计和统计,并形成
26、份析汇报功效。q 服务状态监视基于web端,向后台系统管理员提供对全部已注册并公布开放数据API和数据下载服务服务状态信息进行监视统计,并形成份析汇报功效。3.1.2.7 数据使用权标识系统q 块状数据水印服务向数据平台提供webservice形式块数据水印服务接口。q 流数据水印服务向API管理系统和创新工场API系统提供webservice形式流数据水印服务接口。q 水印管理服务基于web浏览器端,向后台系统管理员提供对水印管理和验证功效。3.1.3 创新创业管理子系统3.1.3.1 创新创业应用管理系统q 创新应用APP测试创新工场APP测试:当APP上架之前需要经过后台管理人员测试,创
27、新工场开发者用户应该提供给数据平台测试账号,部署测试环境,提供测试数据,和对应APP部分基础信息。后台管理员会依据提供信息对该APP进行测试。q 创新应用APP公布APP公布:对于测试经过APP应用,后台管理员会进行公布,添加新APP应用,输入APP相关基础信息“名称、开发者、访问方法、说明描述、使用说明及演示地址等”。3.1.3.2 开放数据API管理系统q API公布开放数据API公布:API数据系统关键提供给用户使用API方法,进行数据下载。是经过接口形式,实时获取最新数据。后台管理员上架API,填写API具体信息包含:API数据描述(api收费情况描述、接口作用信息、接口参数对照信息、
28、返回字典等信息),接口信息(调用地址、返回格式),API调用文档,和API调用地址。以后会经过后台管理人员审核确定API经过审核,才会公布到数据平台。q API测试API公布之前必需经过测试,确保API可用性、正确性、和数据完整性,对部分法律要求不许可公布数据将不给予公布。3.1.4 数据统一展示门户子系统3.1.4.1 数据统一展示门户数据统一展示门户关键为一般用户提供浏览、确定数据范围功效,数据是由平台或数据供给商提供,用户能够经过分类、查找、过滤等方法找到自己关注数据,然后查看数据具体信息,数据本身全部是经过脱敏和加密,符合对外展示具体要求,成为数据驱动运行体系统一对外展示接口。数据统一
29、展示门户系统功效包含,数据展示,数据过滤功效,数据查找功效,数据列表,数据具体信息。q 数据展示数据展示功效关键是将数据种类、描述、样例、历史访问量等信息展示给用户,以方便用户分析使用。具体包含以下内容: 数据分类显示数据分类会出现页面头部导航栏,当用户把鼠标放到某一大分类出,弹出目前大分类下全部子分类,用户点击子分类进入目前子分类相关数据具体列表页面。 数据过滤功效提供标签过滤功效,用户点击其中某个标签,会根据此标签 和之前过滤标签重新过滤目标数据。目标数据将以标签匹配数据标题关键字查找出来,以列表形式展示出来,以供用户选择。 数据查找功效提供查找功效,用户经过页面搜索查找相关输入关键字所匹
30、配数据,搜索框前能够选择搜索数据标题还是搜索详情,默认是标题关键字,输入数据关键字,依据程序处理搜索相关数据关键字匹配,以列表形式展示出来以供用选择。 数据列表数据列表会展示目前用户选择或默认分类下全部数据,会以列表分页形式展示,根据时间默认排序。目前列表会展示数据部分基础信息“数据标题、数据质量评分、数据图片、数据访问量和数据简单描述”;假如目前登录用户为创新工场用户,创新工厂用户进入API列表,api标题后会多出金银铜等级,只有符合目前等级用户才能够调用目前API数据。 数据具体信息数据具体信息,点击数据标题进入目前数据具体信息页面。会显示目前数据具体信息,包含“数据图片、数据标题、数据价
31、值、数据起源、数据上架时间、数据大小、目前数据下载量、数据简短描述、目前数据完整性(八个指标)、收藏、推荐相关目前数据相关数据、数据具体信息、访问过用户对目前数据评论信息”。q 数据检索数据检索包含,标签筛选,数据关键字及具体信息搜索。用户点击其中某个标签,会根据此标签 和之前过滤标签重新过滤目标数据。目标数据将以标签匹配数据标题关键字查找出来。搜索框前能够选择搜索数据标题还是具体信息,默认是标题关键字,输入数据关键字,依据程序处理搜索相关数据关键字匹配,以列表形式展示出来以供用选择。q 用户管理目前平台用户管理分为三类:一般用户管理、创新工厂用户管理、供给商用户管理。一般用户管理:一般用户能
32、够在前台个人中心里管理自己基础信息,查看自己账户信息,修改密码等操作。还能够经过我订单查询目前全部订单,及订单最新状态,查看并管理目前API信息。查看目前系统消息。创新工厂用户管理:创新工厂用户能够在个人中心管理自己基础信息,查看自己目前等级,查看并管理自己账户余额,查看并管理目前API信息,更新自己所购置API版本等,公布自己应用,查看而且管理自己目前已公布应用。查看目前系统消息。供给商用户管理:供给商用户能够在前台个人中心里管理自己基础信息,查看而且管理自己数据状态,修改密码等操作。公布数据,查看自己公布数据情况。查看目前系统消息。3.1.4.2 数据共享交换系统q 数据聚集配置管理基于w
33、eb端,向后台系统管理员提供对数据平台主节点和分节点/独立数据终端系统之间数据聚集操作配置管理功效。q 数据在线聚集基于web端,向后台系统管理员提供进行数据在线聚集传输操作管理功效。q 数据离线聚集基于web端,向后台系统管理员提供进行数据离线聚集传输操作管理功效,包含数据离线聚集包导出及导入功效。q 数据共享交换日志管理基于web端,向后台系统管理员提供数据共享交换业务操作日志统计检索浏览功效。3.1.4.3 数据访问规则系统q 访问规则管理基于web浏览器端,向后台系统管理员提供基于内置数据访问业务规则,对特定用户或特定数据服务进行访问规则设置管理功效。q 数据访问服务向平台提供基于we
34、bservice形式API数据访问服务接口。q 访问信息服务向平台提供基于webservice形式API数据访问历史统计信息检索服务接口。q 访问规则管理对数据访问相关各类规则进行统一管理和配置。3.1.5 用户及权限管理子系统3.1.5.1 用户信息管理系统q 数据平台注册用户管理平台注册用户管理,系统管理员能够在后台进行平台注册用户管理。经过用户管理,能够查看用户订单,和发觉不正当用户后,对用户冻结功效。q 创新工场用户管理创新工场用户管理,系统管理员能够在后台对平台全部创新工场用户进行操作。能够在后台用户管理中创新工场用户管理中设置。能够进行查看目前全部创新工场用户列表及具体信息“ 创新
35、工场用户名称、所公布API、公布时间、账户信息、用户等级等。”管理员还能够对新申请创新工场用户进行审核,对不符合创新工场用户条件申请进行驳回。对已经经过审核创新工场用户账户进行冻结,叫停该用户在应用市场所公布应用。q 数据供给商管理数据供给商管理,系统管理员能够在后台对平台全部数据供给商进行操作。能够在后台用户管理中数据供给商管理中设置。能够进行查看目前全部供给商列表及具体信息“供给商名称、所提供数据、时间等。”管理员还能够对新申请数据供给商进行审核,对不符合数据供给商申请进行驳回。对已经经过审核数据供给商进行冻结,叫停所公布数据等操作。q 系统管理员管理系统管理员管理,超级管理员账号能够在后
36、台配置相关系统管理员权限,设置不一样管理权限从而实现不一样角色管理员划分,比如订单管理员,只能进行订单操作,无法操作其它菜单。超级管理员能够在后台用户管理中配置相关系统管理员权限。3.1.5.2 授权管理系统q 数据服务分组管理和授权 基于Web浏览器端,向后台系统管理员提供对数据服务进行分组定义和分组管理设置功效。 基于Web浏览器端,向后台系统管理员提供将数据服务分组和用户分组进行对应关系设置和管理,根据对应关系对用户组进行数据服务授权功效。q 数据服务分级管理和授权 基于Web浏览器端,向后台系统管理员提供对数据服务进行分级定义和分组管理设置功效。 基于Web浏览器端,向后台系统管理员提
37、供将数据服务分级和用户分级进行对应关系设置和管理,根据对应关系对用户等级进行数据服务授权功效。q 数据服务单独授权 基于Web浏览器端,向后台系统管理员提供为特定用户对特定数据服务访问授权进行管理控制功效。 提供针对特定用户访问特定数据服务授权WebService服务接口。q 数据访问权限管理数据访问权限管理:一般用户及其供给商用户只能够访问一般块数据,及API。创新工厂用户除了能够查看一般块数据,及API,还能够调用创新工厂中对应着自己账户等级API。3.1.5.3 身份认证和访问控制系统q 用户身份认证提供WebService形式用户身份正当性认证服务,依据用户名和口令进行用户身份比对认证
38、。q 数据服务动态Token授权服务向用户提供获取数据服务(开放数据API服务和块数据下载服务)访问授权动态TokenWeb服务API,经过用户身份认证和数据服务访问权限认证后,向用户返回最新数据服务调用授权动态Token。q 数据服务访问控制对用户向数据平台发送数据服务调用请求进行有效性验证和访问控制。3.2 大数据平台运行维护服务创新创业大数据平台项目包含软硬件系统范围较广,且承载了关键关键数据资产,其稳定运行保障十分关键,勤智数码依靠本身十多年IT运维经验,建立一套基于ISO/IEC0和ITIL v3理论,遵照ITSS、GB/T 28827-系列运行维护服务国家标准运行维护体系,对平台中
39、各子系统和各功效模块提供统一监控维护服务,包含服务提供状态监控、服务使用状态监控、系统运行状态监控等。包含以下平台运维服务: 3.2.1 平台内部资源监控管理对平台所包含全部硬件资源、软件资源和数据资源进行实时不间断7x二十四小时监控和管理,合理设定资源状态预警阈值设定,确保任何资源状态异常立即通报和展示,经过声光报警、短信、邮件立即通知,确保管理人员立即发觉和处理问题。同时借助大数据平台优势,实现平台内部软件、硬件资源运行状态趋势估计,不一样资源告警阈值智能化管理和自动设定,做到平台内部运行状态稳定和连续。q 硬件资源监控大数据平台硬件资源较多,全部硬件资源包含:路由器、交换机、防火墙、主机
40、(window、linux、Solaris、HP-Unix、AIX等)、虚拟服务器、无线设备AC/AP、存放设备、光交换、其它安全设备等监控,监控方法支持snmp v1/2/3、ssh/telnet、TCP、syslog、trap、脚本、WMI、netflow/cflow/sflow/netstream协议等。 支持对大数据平台包含多种设备状态实时监控(如:通断、资源使用情况、端口状态、流量峰值、流量改变量等其它关键指标等) 支持网络设备流量应用层协议分析和监控. 借助类似曲线图表现大数据平台内部最近一个小时,最近一天,最近一周,最近一月,最近十二个月服务器或集群cpu负载,内存,网络,硬盘等
41、指标 支持各类监控指标告警阈值人工和自动调整 支持告警信息短信、邮件通知和声光报警通知 支持网络拓扑和机房视图可视化管理 支持网络资源配置自动备份q 软件资源监控大数据平台内部软件资源复杂,需要支持统一化一体监控模式,支持对Hadoop架构体系内全部软件模块和系统(HBase、HDFS等)、关系型数据库(MySQL集群、Oracle、SQLServer等)、中间件系统、前端应用、软件TCP端口等软件资源监控和管理,支持SNMP、SSH/telnet、JMX、JDBC等监控方法和协议,实现: 支持大数据平台内部多种传统关系型数据库和数据库集群、Hadoop架构中HDFS/HBase等状态、内存数
42、据库状态、各类中间件资源状态、平台内部和前端应用状态、各类内外部接口状态实时监控 支持各类监控资源告警阈值人工和自动调整 支持告警信息短信、邮件通知和声光报警通知 软件信息变动和资源使用异常等关键指标监控 基于软件关联关系监控,实现基于多个软件和硬件业务等级监控3.2.2 平台故障处理管理大数据平台包含软硬件信息和数据量较大,平台上线运行后见面临海量故障信息,故障信息分析是运维工程师面临难题,而云计算、虚拟化等新技术广泛采取深入加剧了运维管理复杂度。需要对运维步骤进行梳理,将技术人员从繁重运维工作中解脱出来,实现运维作业标准化、自动化,缩短业务响应时间,提升服务质量。平台各类故障和告警处理管理
43、关键针对平台运行期间全部异常事件统一管理,确保全部异常事件全部被处理管理功效。借助国家标准和ITILSLA模型,需要建立一套完备故障事件、问题、变更和公布等标准化故障处理步骤,规范故障处理过程,做到故障立即处理、追踪、统计,确保每一个问题和故障全部能被立即处理。提供页面/邮件/短信/声音/光/消息用户端/WebService接口立即经过责任人进行告警处理。3.2.3 日常平台管理任务自动化日常平台管理工作中有很多是标准化工作,如巡检、值班等工作。这些工作会占用大量时间,将人工操作、管理转变为系统自动化操作和管理,能够节省时间,将精力投入到更紧急、更关键工作中。q 自动巡检功效平台监控管理系统自
44、动将需要巡检设备状态发送到系统中,自动进行设备运行状态和关键指标性能数据搜集汇总形成自动巡检结果,同时巡检过程全程统计,经过巡检工单,能够跟踪巡检实施情况。q 人工巡检功效针对非监控资源巡检,可经过系统内提供人工巡检功效完成巡检结果统计,为巡检任务实施计划、监督和结果电子化管理提供了有效手段。q 值班管理系统提供值班管理功效实现管理人员排班、值班、交接班等信息电子化管理,系统自动排班。3.2.4 故障处理自动化q 告警处理过程经过基于ITIL事件、问题、变更等标准化步骤进行管理q 系统自动进行告警过滤、压缩,避免海量告警。q 自动将关键告警经过消息发送给责任人。q 系统自动运行预定义脚本恢复故
45、障。q 对于需要技术人员处理故障,系统自动创建工单,派发给管理人员处理。q 系统自动关联知识库,帮助技术人员处理工单。q 技术人员处理结束后处理方案一键转知识,知识不停累积。q 平台内部管理移动化支持移动终端平台状态监控和故障事件处理,实现管理人员不在现场时实时平台状态监管,实现平台状态监控管理移动化办公。移动终端能够经过政府内网无线网络系统直接接入、也能够经过互联网经过加密专用VPN通道访问政务内网特定资源。3.3 科研教授和数据资源以勤智数码和成全部电子科技大学联合成立“机器学习和数据智能联合试验室”进行挂牌,为大数据平台发展提供优质科研教授资源。以国信优易分中心形式挂牌,平台提供和国信优
46、易数据访问接口支持,创新创业大数据平台成为整个地域访问国信优易拥有国家部委关键数据资源唯一入口。依靠国信优易未来国家级大数据共享促进中心发展定位,将在未来基于数据驱动运行体系中会处于很有利发展格局。4 项目收费和收益模型政府委托勤智数码作为创新创业大数据平台建设和运行方,提议由政府指定全资企业和各个委办局签署数据共享和使用协议,该全资企业和勤智数码签署服务框架协议,由政府向勤智数码以购置服务方法来支撑大数据平台正常运行,收费模型确保项目标投资收益。现在计划收费和收益模型总结以下:4.1 平台运行服务政府每十二个月向平台支付平台运行服务费,平台为政府提供以下服务内容: 勤智数码为政府建设一套创新
47、创业大数据平台,为实现政务数据共享交换能力,为政府内部数据共享、分析和挖掘提供必需服务。 基于勤智数码为政府建设大数据平台,为智慧城市建设历程中全部垂直行业应用提供底层统一数据平台支撑能力,为政府实现城市级数据沉淀提供必需服务。 勤智数码为创新创业大数据平台提供专业运行维护服务,确保平台连续稳定运行。 平台提供国信优易数据访问接口服务,作为区域内唯一访问接口对外提供服务。4.2 数据运行服务收益政府委托勤智数码对平台内数据和上层应用进行全方面运行,借助平台中基于数据驱动运行体系直接收益。计划根据现在已计划政务数据、国信优易数据、智慧城市运行产生数据等,数据价值巨大,初步预估超出数十亿元。政府全资企业能够取得数据运行直接收益30%。结合平台建设投资计划,估计数据驱动运行服务起始阶段属于无收益投资阶段,伴随平台运行收益程逐年增加,预估整体最终在23年左右后开始收益。4.3 大数据产业链发展促进收益经过对创新创业项目标孵化,产生落地