1、前 言随着信息技术的快速发展与广泛应用以及居民对于城市治理水平、公共服务水平、居民生活质量、生态环境保护等方面诉求的不断增加,智慧城市的建设已经成为全球城市发展的重要趋势,伴随着大量智慧城市相关项目的落地,智慧城市相关业务系统运维保障的诉求也在日益增加,因此如何依托先进的技术、方案、资源,建立完善的智慧城市运维服务体系至关重要。中国移动作为全球最大的通信运营商,积极投身于智慧城市建设与运维,以推动信息通信技术与城市运营的深度融合,为城市居民创造更美好的生活体验。中国移动在智慧城市运维方面具有得天独厚的优势。首先,中国移动拥有庞大的用户群体和丰富的信息资源,可以为智慧城市建设、运维提供数据支撑和
2、信息平台支持;其次,中国移动在通信技术、云计算、大数据、物联网等领域具有很强的技术实力和经验积累,可以为智慧城市提供可靠的运维技术保障和解决方案。本书结合中国移动在智慧城市运维领域的探索与实践经验,通过阐述智慧城市相关政策导向、行业发展现状对智慧城市领域发展趋势进行了剖析;通过智慧城市运维愿景、内涵的相关描述总结了智慧城市运维的本质及目标;依托运维全生命周期服务范围的制定为智慧城市运维标准体系的建设提供了指导原则;从流程、技术、资源及项目案例方面分别阐述了中国移动在智慧城市运维领域的服务能力。旨在为推动智慧城市的可持续发展及平稳运行提供有力参考。本书编写组指导单位中国移动集团公司政企事业部编写
3、单位中移系统集成有限公司云智慧(北京)科技有限公司润建股份有限公司华为技术有限公司北京直真科技股份有限公司主编高有军、刘子毅(中移系统集成有限公司)参编赵剑明、贾然、杨维强、周欢欢、许伟杰、李东太、徐鲁旭(中移系统集成有限公司)张博、李伯涵、卢鑫源(云智慧北京科技有限公司)陈盼、汤志伟、孙任、唐雪林、黄能柠(润建股份有限公司)徐波(华为技术有限公司)王杰、杨朝令(北京直真科技股份有限公司)目录01行业趋势02愿景内涵03服务内容04能力简介05典型实践06生态合作201行业趋势31.1智慧城市的概念及实践在全球范围内得到了广泛的关注和推广,并已成为政府、企业和公众合作改善城市服务、提高生活质量
4、、促进经济发展和保护环境的重要途径。智慧城市运维涉及的范围广泛,包含了信息技术、环境保护、公众参与等多个领域。政策导向成为推动和规范智慧城市运维发展的关键因素。(1)多项政策都在鼓励和指导智慧城市朝着数字化方向发展。例如,十四五规划明确提出加快构建以全球领先的数字基础设施为支撑的数字中国,这为智慧城市运维的数字化提供了方向。(2)数据安全法明确规定了数据收集、处理和使用的标准,智慧城市运维必须严格遵守相关规定,确保数据安全与公民的隐私权利。智慧城市运维过程中,网络安全至关重要。(3)网络安全法要求必须建立完善的网络安全保护体系,对信息系统进行定期检查和评估,加强数据的存储和传输安全。(4)智慧
5、城市应致力于环境保护和节能减排,国家的环保法规为智慧城市运维提供了清晰的标准和指引。(5)根据国家的社会治理现代化方向,智慧城市在运维过程中应增强公众参与,通过互动交流平台等方式,让市民更好地理解和参与城市的运营管理。(6)国家正积极倡导建立“政府、产业、学术、研究、民用”等多元协同创新机制,这为智慧城市运维模式创新提供了可能。4(7)政策鼓励引入最新的科技进行数据分析预测,提供更高效率的服务。例如,人工智能、区块链、大数据等在智慧城市运维中的应用。总的来说,国家针对智慧城市运维的政策导向,不仅规范了数据、网络安全的使用,也指明了智慧城市的发展方向,并为智慧城市创新运维模式提供了政策支持。它们
6、将一同推动智慧城市运维更高效、更安全、更人性化的发展,提升公民的生活质量和幸福感。1.2智慧城市是指在城市管理和发展过程中,通过运用先进的信息技术和通信技术,实现城市各项功能和服务的智能化、高效化和可持续发展。运维作为保障智慧城市平稳运行的重要一环,随着智慧城市建设要求的不断提高,及科技的不断进步和全球城市化的快速发展,智慧城市运维行业也呈现出蓬勃的发展态势。主要表现在:(1)运维平台的智能化发展:随着人工智能和机器学习技术的不断发展,智能运维平台在提升运维效率、实现智能化管理方面,起到重要的作用。它通过自动化的方式,可处理大量重复性的工作,极大地提高了工作效率;可以通过大数据技术,识别出潜在
7、的风险和问题,提高系统可靠性;它还可以通过对历史数据和实时数据的分析,提供针对性的建议和优化方案,进一步提升运维效率和管理水平。(2)自动化运维工具的应用:随着运维技术的发展,越来越多的自动化运维工具被应用到企业中,例如 Ansible、Puppet 等。这些工5具可以帮助企业更好地实现自动化部署、配置管理、容器化等方面的运维工作。(3)智慧城市运维行业借助大数据分析技术,能够收集、整理和分析大量的城市运行数据,从而提供科学、精准的决策支持。这使得城市管理者能够更好地了解城市的发展趋势和问题,并及时采取有效的应对措施。(4)运维安全性的重视:随着网络攻击和数据泄露事件的增加,运维安全成为企业关
8、注的重点之一。因此,如何在保障业务正常运行的同时,加强运维安全成了一个重要的课题。(5)运维人员技能的要求提高:随着运维技术的不断发展,对运维人员的技能要求也越来越高。运维人员需要不断学习和掌握新的技术、工具和方法,才能更好地适应企业的需求。(6)人工智能和机器学习在运维领域的应用逐渐增多。602愿景内涵7中国移动在智慧城市 IT 运行维护领域的愿景是结合智慧城市相关信息系统的技术、业务特点,建设一个高效、智能的运维体系,通过先进的技术和管理方法,实现对智慧城市相关信息系统的持续支持和优化。核心目的是提高智慧城市相关的业务运行效率,降低运维成本,保障业务稳定和安全进而达到提升城市运行管理和公共
9、服务水平,提高城市居民幸福感和满意度的最终目的。为了实现这个愿景,智慧城市 IT 运行维护需要实现以下几个方面的目标:(1)提高智慧城市 IT 运行维护服务的智能化、自动化水平,实现对 IT 系统的智能监控、故障预警和自动处理,减少人工干预。(2)优化智慧城市 IT 运行维护流程和管理体系,建立标准化、规范化的运维流程,提高运维服务的质量和效率。(3)提升智慧城市 IT 运行维护的质量,加强对运维人员的技能培训和团队建设,提高运维团队的综合素质和业务能力,保障运维服务的稳定性和可靠性。(4)保持智慧城市 IT 运行维护的创新性和适应性,随着技术的快速发展和业务需求的不断变化,智慧城市 IT 运
10、行维护需要保持创新和适应性。通过引入新的技术和方法,可以不断优化和改进运维流程,以适应不断变化的环境和需求。8智慧城市 IT 运行维护的本质主要是通过合理地利用运维服务所涉及的流程、人员、技术、资源来确保运维服务的目标,保障系统主体可以正常、高效、平稳、安全的运行。通过合理的智慧城市 IT 运行维护管理流程规范,确保智慧城市 IT运行维护工作的高效执行,并使运维工作人员的工作变得有章可循,降低了工作的难度,保证了工作的质量,提高了工作的效率。通过设置合理的智慧城市 IT 运行维护人员组织架构及制定合理的人员技能提升机制可以提升整体运维服务的效率,确保运维服务的质量。通过智慧城市 IT 运行维护
11、相关的新技术采用、新平台的打造、新应用的丰富以确保智慧城市 IT 运行维护在快速地新技术变革、迭代过程中的创新性和适应性。充分利用各类智慧城市 IT 运行维护资源如运维管理平台、告警监控平台、灾备管理平台、智能客服系统等来提高整体运维服务的自动化、智能化、标准化水平。903服务内容10运维全生命周期服务是一个综合性的服务模式,旨在保障企业 IT系统全生命周期的平稳、安全、高效运行。本文以 ITSS 中 IT 服务生命周期(PIOIS):规划设计、部署实施、服务运营、持续改进、监督管理为指导原则,结合智慧城市系统运维服务诉求特点,制定了智慧城市系统运维全生命周期服务内容要求,进而更好地帮助智慧城
12、市领域相关客户节省时间和成本,提高系统的稳定性和安全性,从而保障智慧城市相关领域业务持续向好地发展。图 1 智慧城市运维全生命周期服务113.1.1 运维咨询智慧城市运维咨询需根据 ITSS 规范与地方标准相结合为客户提供一系列运维咨询服务,旨在帮助城市有效整合和使用各种资源,以达到更好的管理效果和公共服务质量。可以为城市提供全方位的支持,助力城市科技化、智能化,有效地提升城市管理和服务水平,提高居民的生活质量。(1)需求支持智慧城市运维咨询的需求支持需要全面覆盖技术、业务、政策、人力资源和应急响应等方面,为智慧城市运维提供专业、系统、有效的咨询服务。在智慧城市运维过程中,可能需要引入不同的信
13、息技术,如大数据、云计算、物联网等。因此,技术咨询需求将提供如何合理选择和使用这些技术,包括系统或平台的选型、架构设计、软硬件配置、系统测试和优化等。咨询服务可以针对不同的城市业务流程,提供优化和改进建议。例如,对于公交调度管理、环保监测、公共安全等具体业务,都需要详细分析现有运维流程,然后提出优化方案。由于智慧城市涉及众多法规政策,咨询还包括如何符合相关法律法规,尤其是关于数据安全和公民隐私的法律法规,以及专门针对智慧城市的国家或地方政策。12智慧城市运维需要一支高效的团队,咨询服务应提供如何建设和管理这个团队,包括人员培训、团队激励、人员配置等。咨询服务需要提供如何应对各类紧急情况的建议,
14、包括设备故障、数据泄漏、网络攻击等,以保证智慧城市运维的持续稳定。(2)数据分析咨询在智慧城市项目中,数据是最重要的资产之一。咨询服务可以帮助城市建立高效、安全的数据管理体系,包括数据收集、存储、分析和使用等方面。通过先进的数据分析方法和工具,可以从数据中提取出有用的信息和知识,以辅助决策和优化服务。(3)IT 基础设施咨询IT 基础设施咨询可以提供高效、安全、稳定的运维服务。智慧城市运维中的 IT 基础设施咨询,涵盖了对智慧城市的硬件和软件设备的规划、配置、优化和管理等服务。这类咨询主要帮助实现智慧城市的运维效率、安全性和稳定性。包括物联网卡在内的硬件设施是智慧城市 IT 基础设施咨询的重要
15、组成部分。物联网卡能够实现设备间的互联,使得各类设施能够互相通信、共享数据,提升智慧城市的运维效率。对于物联网卡,咨询需要包括选择适合的类型(如 NB-IoT、LoRa 等)、正确的配置、有效的管理等方面。除此之外,咨询服务还应当介入计算设备、网络设备、存储设备等的选择和配置,确保它们能够满足智慧城市运维的需要。同时,还需要提供关于云计算平台、数据中心、服务器等的规划和优化建议。13在软件方面,咨询服务应当覆盖操作系统、数据库、中间件、应用软件等的选型、配置和优化,以及如何有效地进行软硬件之间的配合,实现最大的运维效率。(4)运维安全咨询在构建智慧城市相关系统时,安全是一个不可忽视的问题。运维
16、安全咨询服务可以提供全面的安全咨询,包括制定安全策略、评估系统安全性、解决安全漏洞、应对安全事件等。通过这些服务,可以有效保证智慧城市的数据和服务安全。(5)运维优化和自动化运维咨询服务可以帮助智慧城市相关项目改进运维流程,提高运维效率,降低运维成本。可以通过引入新的运维工具和技术,实现运维任务的自动化,提升服务质量和稳定性等。(6)成本评估提供运维成本评估咨询服务,通过分析智慧城市项目的运维成本结构、制定成本预算和优化成本策略等,帮助客户实现成本控制和优化,提高项目整体效益。(7)风险管理提供运维风险管理咨询服务,包括建立风险评估指标体系、制定风险应对策略和定期进行风险监测等,帮助客户有效预
17、防和应对潜在风险,确保智慧城市项目的稳定运行。143.1.2 运维建设智慧城市的运维建设,宗旨是保障智慧城市的各项服务和基础设施的平稳运行,智慧城市的运维建设是一个复杂的过程,需要多种专业知识和技能。但只有做好了这些工作,才能确保智慧城市的稳定运行,提供优质的服务,满足人们的需求。确定以网络安全、数据安全为底线,保障智慧城市业务系统稳定运行。首先制定运维管理制度、制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程规范。其次根据 SLA 组建终端硬件服务网点、业务系统运维驻场团队、IT 基础运维团队、二线专家团队。最后在集中运维中心设立统一的运维服务台、运维监控、工单流程、
18、智能客服、资料管理、数据备份管理等运维辅助工具。关注运维阶段出现的问题,做到及时发现问题、解决问题,并同步实现风险防控。图 2 运维管理体系153.1.3 运维保障智慧城市的运维保障是一个全面、持久的过程,其目标是确保城市的信息化设施和服务能够稳定、安全、高效地运行。智慧城市的运维保障服务需要全方位、全时段、全过程地确保系统和服务的正常运行,为用户提供高效、质优、安全的服务,从而提升城市的智能化水平和居民的生活质量。主要通过以下三个方面进行运维保障。在技术方面,通过各种手段保障服务的可用性和稳定性,并且具备良好的技术创新和问题解决能力,能够及时应对系统故障、网络安全问题以及日常维护中出现的各种
19、挑战,确保系统的正常运行。同时具备良好的沟通能力,能够清楚、准确地向客户解释复杂的技术问题和方案,提供全面的用户支持服务,解答用户的问题,解决用户在使用服务中遇到的困难。例如使用负载均衡技术提高服务的处理能力,使用冗余和备份技术防止系统故障,采用先进的监控工具实时监控系统的运行状态,采用多层安全防护措施,以保护智慧城市系统和数据免受攻击。在设备维护保养方面,服务器等软硬件、配套类基础设施可采购原厂商或有资质的第三方服务商并约定 SLA,确保系统设施疑难问题和紧急问题快速定位解决,保障业务的安全稳定运行。在流程方面,首先建立快速响应机制,及时处理和恢复故障问题。其次,制定符合智慧城市特点的运维管
20、理制度规范、流程规范,对过程进行监督考核、持续改进;制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程,这包括制定故障处理流16程、建立应急预案,以及提供 24 小时的技术支持服务等。最后建立完备的灾难恢复计划,并进行定期的演练,以确保在发生重大故障或灾害时能迅速恢复服务。实施主动维护,定期检查设备软硬件运行状态、配置是否符合规范要求。从技术力量、应急资源、调度机制等方面建立重大保障的服务体系,为客户提供重大节假日、重大事件、重大活动等重要时期的专项保障服务,确保重保期间业务稳定性、可用性及连续性。在资源方面,建设使用监控、工单、智能客服、资料管理和数据备份等运维管理工具
21、,提升运维效率,提升项目运维阶段信息化管控能力,组织开展基于运维数据的运维经营分析工作,持续优化项目运维能力。运维创新能力是指通过引入先进的管理方法及制度规范,优化运维工作流程,充分利用现有的运维辅助工具,不断探索新的运维技术,从而确保运维服务工作的高效性、稳定性、节约性及创新性。中国移动通过对自身运维咨询能力、运维建设能力、运维人员能力、运维培训能力等方面的充分整合及创新为智慧城市运维提供了技术保障基础;通过先进的管理、流程规范的建立使智慧城市运维服务执行有章可循,提高了运维工作效率和问题解决速度,为客户创造更大的商业价值;通过引入先进的运维辅助工具促进智慧城市运维的自动化、智能化,提高了运
22、维工作的可靠性,降低了运维的成本;通过17新技术与运维服务结合的不断探索研究确保了智慧城市运维服务的创新性、适应性。1804能力简介19中国移动积极推进网络运维的数智化转型升级,率先开启“三零三自”数智化运维转型之路,面向客户提供“零等待、零故障、零接触”的新型网络与 ICT 服务,面向一线运维打造“自配置、自修复、自优化”的数智化运维能力,积极融入国家科技创新体系布局,主动承担国家重大科技创新专项。统筹推进自智网络升级演进,攻关填补多项网络与 AI 融合的技术空白,积极分享中国移动自智网络的理论与实践创新成果。设立“移动信息产业链-自智网络子链”,充分争取政策支持,建设了“智慧网络国家新一代
23、人工智能开放创新平台”,汇聚产、学、研合作伙伴,打通理论、技术、标准、应用的创新全链条,打造跨领域、大协作的协同创新基地,进一步提升产业链的竞争力和服务能力。中国移动基于对智慧城市数字化运维转型诉求的洞察,以及在通信领域多年的经验积淀,运用基于服务化的架构、DevOps、AI 等先进的技术和理念,为客户提供全向能力匹配的运维系列产品及虚拟化运维转型服务,赋能客户在 5G 时代的数字化转型。中国移动基于服务化架构和 ITIL 标准的服务流程,为客户构建了面向 5G 网络的运维管理系统和管理流程。紧密围绕中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要政策指引,全面落实
24、“十四五”总体发展规划,形成“五位一体”的 IT 运维服务总体架构,如图 3 所示。20以“强大的运维保障工具、完备的运维管理制度、先进的运维服务理念、科学的运维组织架构和关键的 IT 运维技术”为主要组成部分的 IT 运维服务体系,构建起一座坚固的运维服务力量大厦,以确保各项业务的顺利展开。把做大做强做优 IT 运维作为振兴突破口,全面助力数智化转型发展。图 3 OneService 运维服务系统(1)强大的运维保障工具OneService 一体化运维平台,主机监控、业务监控、运维客服、资料管理、运维工单系统、报表管理、自动化运维中心等,以数据为基础、以 AI 为支撑、以业务为向导,应用先进
25、的实时大数据和机器学21习技术,IT 运维与业务经验深度结合,打通后端 IT 支撑系统与前端业务应用之间的信息断层和管理断层,提升业务与管理效能。建立 24 小时运维客服热线和值班制度,用户在使用中遇到的困难问题可以第一时间帮助解决,也可以不断进行自我完善,不断提高服务质量。(2)完备的运维管理制度为确保运维服务工作正常、有序、高效、协调地进行,根据国家、工业和信息化部颁布的相关政策、技术体制、业务规程、法规等的内容和要求制定一系列管理制度,覆盖各类运维模块,包括从组织实施到施工验收的各个方面,实现运行维护工作的标准化、规范化。(3)先进的运维服务理念在互联网化和移动化的背景下,传统的运维边界
26、变得越来越模糊。随着虚拟化和云计算等技术的出现,运维管理的复杂度和难度大大增加,传统的运维思维已经无法适应当前日新月异的运维服务,我们通过不断地学习、融合、创新,打造先进的运维服务理念,为客户提供全方位的运维服务。(4)科学的运维组织架构我们构建了科学全面的运维组织架构,在运维管理委员会的管理下,项目管理组、专业支撑组、现场保障组、后备资源组各司其职,对客户问题提供及时且高效的响应,保证客户问题及时有效解决。(5)关键的 IT 运维技术22我们一直秉承着开放、融合的运维理念,在多年运维经验基础上不断引进新的技术与能力,形成针对各类运维场景的技术与能力。(6)发挥标准引领作用中国移动作为 DIC
27、T 的领航者,结合自身优势与中国信通院、中国信标委等组织联合编制一体化政务云智能运维平台技术能力要求信息技术应用创新政务云平台性能要求信息技术云计算分布式云通用技术要求信息技术云计算云迁移工具技术要求等多项标准文件。(7)卓越的绿色节能运维能力中国移动致力于提供绿色节能的运维管理服务,紧跟“碳中和、碳达峰”战略目标,打造绿色节能运维管理机制,在保障系统设施安全稳定运行的基础上,采用卓越的绿色节能管理措施,优化系统能耗结构,实现绿色节能运维。4.1.1 全面的运维技术(1)运维咨询能力中国移动具备运维顶级咨询能力,主要涵盖了广泛的专业知识、技能和经验,它能够帮助城市从技术和管理等多个方面进行智慧
28、化改造。集合了多种专业知识和技能,能够为智慧城市的建设和发展提供强有力的支持。以下是一些重要的运维咨询能力:具备丰富的 IT 技术知识和实践经验,包括硬件、软件、网络、数据库、安全等各个方面。能够理解和分析复杂的技术问题,提出有效23的解决方案。能够进行数据清洗、挖掘、分析等工作,使用先进的工具和算法,从大量的数据中提取出有价值的信息和知识。了解各种安全风险和威胁,掌握防火墙、入侵检测、加密等技术,能够设计和实施全面的安全策略。掌握城市的业务需求和挑战,能够从业务角度思考问题,提出符合实际需要的解决方案。具备良好的沟通能力,能够清楚、准确地向客户解释复杂的技术问题和方案。除了技术和业务层面,还
29、具备战略思考的能力,能够从整体和长远的角度看待问题,帮助城市进行智慧化的战略规划。(2)运维建设能力中国移动围绕集团创世界一流企业及“做网络强国、数字中国、智慧社会主力军”的总体目标,建设新型智慧城市运营商。打造以智慧城市 OneCity 为核心的产品能力体系,以树立新理念、采用新技术、打造新平台、丰富新应用、构建新生态为宗旨,提供全面的 DICT 集成服务,助力智慧城市建设。图 4 DICT 集成能力体系24中国移动具备多项 IT 领域相关的专业公司资质及证书,如 ITSS信息技术服务标准符合性证书(运行维护方向),ITSS 信息技术服务标准符合性证书(云服务方向),信息安全管理体系认证证书
30、和信息技术服务管理体系认证证书,质量管理体系认证证书和信息安全服务资质认证证书等,这些资质和认证表明了公司在 IT 服务、信息安全、管理体系和云服务等方面的专业能力和成熟度。同时也可以提供系统化运维体系的建设和运维产品的建设,以提高城市运输、安防、公共服务等各方面的管理效率。运维体系的建设主要通过对硬件、软件和人员的管理,保证系统的稳定、安全、高效运行。运维产品则涉及各类高科技工具如 AI、大数据等,引领城市资源配置的智能化,以满足城市功能的多样化需求。强大的运维建设能力为客户提供了可靠的基础设施保障,为智慧城市的持续健康发展打下坚实的基础。4.1.2 完善的运维流程制定符合智慧城市特点的运维
31、管理制度规范、流程规范,同时对过程进行监督考核、持续改进;制定问题处理、资产管理、事件管理、问题管理等覆盖运维全生命周期的线上流程,确定智慧城市运维场景,梳理出智慧城市统一运维流程。中国移动编制建立了完善的管理体系和运维制度,常态化支撑制度的有效落实,检查各项制度的执行情况,并根据运维服务工作情况持续优化完善。25图 5 运维管理制度根据智慧城市运维需求,梳理定制统一的、可执行的、符合 ITIL标准的服务流程,规范运维服务,并注重服务流程监控和改进。图 6 运维服务管理流程建立明确的运维团队职责分工,从云资源、主机、数据库、业务系统等各方面做到事事有人负责,件件有人响应。26图 7 运维管理责
32、任分工建立覆盖全业务系统的工单管理体系,对各项日常运维工作进行统一报备和审批,做到全面纳管,定制符合现状的运维工单流程,满足各种类型流程需求。图 8 各类运维工单流程建立 4A 安全管控流程,对全量业务系统的主机进行纳管,运维人员通过 4A 平台政务外网或互联网客户端进行账号认证,双因子账号认27证通过后,发起资源操作申请,待运维、安全组审批通过后可通过 4A堡垒机登录主机,在进行主机、数据库高危操作时会触发金库审计功能,需再次提交金库申请方可可继续操作。图 9 主机访问流程针对公众侧、政府侧建立完善的问题处理流程,做到问题第一时间响应和处理。图 10 问题响应处理流程资源的申请、变更、回收全
33、生命周期进行流程化管控,在满足需求的基础上做到资源的高效利用。28图 11 资源管理流程定期组织开展数据备份恢复演练,验证备份数据的可用性和完整性,对演练流程进行详细精确的制定和把控,做到未练先演,心中有数。29图 12 数据备份恢复演练流程图4.1.3 专业的运维团队(1)运维人员能力运维人员作为智慧城市 IT 运行维护服务体系的建立者和践行者,30其在确保运维服务高质量完成中起着至关重要的作用,依托标准的人员组织架构划分原则作为指导,进行人员职责、层级、角色、权限的合理划分不仅可以保障运维服务的高效率、高质量的执行,也能提升智慧城市相关业务系统服务的可用性、便捷性,降低整体运维成本,进而体
34、现在居民对于城市运行管理和公共服务的信任及满意度的提升上。智慧城市运维必须具备过硬的人员素质,主要包括以下几个方面:1)专业知识和技能:智慧城市运维人员具备广泛的专业知识和技能,包括城市规划、信息技术、通信网络、安全管理、监控与预警技术、备份恢复、数据库、网络、云计算和虚拟化等领域的知识。掌握自动化运维技术,包括脚本的编写,服务自动化部署、配置管理,了解智慧城市系统的工作原理、各种设备的操作和维护方法,并熟悉相关的技术标准和规范。2)技术创新和问题解决能力:智慧城市运维人员具备良好的技术创新和问题解决能力。他们需要能够及时应对系统故障、网络安全问题以及日常维护中出现的各种挑战,并能够提出有效的
35、解决方案,确保系统的正常运行。3)团队合作和沟通能力:运维人员需要具备良好的团队合作和沟通能力,能够与不同的利益相关者进行有效的沟通和协调,共同推进智慧城市项目的运营和发展。4)风险意识和应急能力:智慧城市运维人员具备应对风险和应急情况的能力。具备快速反应和决策的能力,以及在紧急情况下保持冷31静和稳定的心态,并能够有效地组织应急响应工作,最大程度地减少潜在影响。5)持续学习和自我提升:智慧城市运维领域发展迅速,技术日新月异。为了保持运维能力的竞争力,运维人员具备持续学习和自我提升的意识。在日常,积极参加相关的培训和研讨活动,不断了解行业最新动态和技术趋势,并将其应用于实践中。中移系统集成有限
36、公司(雄研产业研究院)作为中国移动通信集团公司政企条线下新型智慧城市领域行业能力建设的专业公司,当前拥有人员总量 4000+,其中各类专业技术人员占比超过 90%。针对运维人员组建方面,公司以明确目标、职责分明、层级合理、资源优化等为人员组织架构划分原则组建了组织统一、职责明确、分工有序、协同高效、技术能力过硬的三级专家支撑团队,打造了智慧城市一体化运维组织。公司拥有经验丰富的各类智慧城市运维领域的专业人员,具备较强的 IT 运维领域的流程规划和方案设计能力,能够针对智慧城市的特性和需求,设计出完整、实用且高效的运维流程;确保各项工作的标准化和有序化;具备审计和评估现有运维流程的能力,根据审计
37、结果进行持续改进和优化,持续提升运维效率和质量;具备一定的指导能力,能够通过培训和示范,使其他人员(包括非专业的 IT 人员)理解并按照既定流程执行相应工作。(2)运维培训能力智慧城市运维培训是保障智慧城市相关业务系统安全稳定运行的32重要组成部分。通过培训,可以提高运维工程师的技术水平和能力,增强客户满意度,推动智慧城市的发展,智慧城市运维培训工作,包括对客户和运维工程师的培训。1)对客户的培训对客户的培训旨在提高客户对智慧城市相关业务系统的理解和操作能力,增强客户的使用体验和满意度,帮助客户更好地利用智慧城市相关业务系统解决实际问题。具体包括以下几个方面:解决方案培训:向客户介绍智慧城市相
38、关业务系统的架构、功能和优势,帮助客户了解智慧城市相关业务系统的整体解决方案,提高客户对系统的认知和理解。平台操作培训:指导客户如何使用智慧城市相关业务系统,包括系统的操作流程、数据分析和应用场景等,帮助客户熟练掌握系统的操作方法,提高客户的使用体验和效率。安全知识培训:向客户介绍智慧城市相关业务系统的安全机制和防范措施,增强客户在系统使用中的安全意识和防范能力,帮助客户保障个人信息和数据的安全。2)对运维工程师的培训对运维工程师的培训旨在提高运维工程师的技术水平和能力,提高运维的质量和稳定性,保障智慧城市相关业务系统的安全稳定运行。具体包括以下几个方面:技术架构培训:深入剖析智慧城市相关业务
39、系统的技术架构和设计理念,包括系统如何进行模块划分、如何实现高可用性设计、如何33保证数据一致性等。使运维工程师能够理解并掌握系统的核心设计思路,从而更好地进行后续的运维工作。系统部署和维护培训:指导运维工程师如何进行系统的部署、配置和维护等操作,提高运维工程师的系统运维能力和效率,保障系统的稳定性和可用性。安全培训:重点强调信息安全技术的重要性,包括如何防范网络攻击、保护数据安全和确保系统稳定性等。向运维工程师介绍智慧城市相关业务系统的安全机制和防范措施,增强运维工程师在系统运维中的安全意识和防范能力,保障智慧城市相关业务系统的安全稳定运行。技能提升:通过定期组织技术交流会、专题培训、参加行
40、业会议等方式,让运维工程师了解最新的技术动态和行业趋势。不断提升自身的技能和水平。4.1.4 先进的运维资源建设使用 4 类运维类工具和 4 类管理类工具,进一步提升智能化运维管理水平。34图 13 运维管理工具(1)智能运维管理平台智能运维管理平台是由一门户、四中心、一管理库组合而成的全栈式智能运维一体化平台。实现资源集中管理,在一个平台上对所有资源统一监控;实现运维操作自动化,运维管理流程化,构建智慧运维大脑,加速推进运维场景无人值守智能化。图 14 智能运维管理平台35(2)数据库运维管理系统从数据库基础资源分配、自动化安装部署、统一运维监控、数据库深度巡检、性能容量管理、高可用管理、S
41、QL 审核管理、备份恢复等功能。为客户实现标准化、自动化、智能化数据库的基础能力。图 15 数据库运维管理系统(3)灾备管理平台围绕容灾业务系统,实现容灾切换与回切、业务系统数据的备份和恢复,容灾环境数据回流,全局流量动态监控,当发生故障导致生产环境无法运行时,灾备管理平台可快速拉起容灾系统,持续提供服务,保障业务不中断。36图 16 灾备管理平台(4)智能客服系统智能客服系统提供以客户服务为核心,统一服务平台,统一服务资源,为客户提供全天候、多媒介、一站式、个性化和智能化服务。图 17 智能客服系统(5)智慧运维管家智慧运维驻场管家通过集中化运维、运营化运维,智能化运维打造高质量、高效率的“
42、管家式运维服务”。37图 18 智慧运维管家(6)4A 安全管控平台实现对主机和数据库的统一安全管控,加强安全管控流程和机制建设,提高信息系统安全防范能力,通过建立统一的管理平台,具备“可管理”“可控制”“可运维”“可管控”的能力。全面提升项目运维安全,杜绝运维人员违规及违法操作,避免数据泄漏。图 19 4A 安全管控平台38(7)能效管理平台能管平台打通数据中心动环系统、群控系统、运维管理之间的信息孤岛,实现精准和全面的能耗分析、能效分析、节能诊断等功能,以数据驱动节能运维工作的进行;引入冷源设备能耗模型和制冷系统参数寻优的 AI 手段,实现制冷系统节能的智能化和自动化。图 20 能效管理平
43、台4.24.2.1 运维技术的发展历程信息系统运维由来已久,运维技术的发展与业界的整个技术趋势发展是相辅相成的。其中在运维发展的过程中,最早出现的是手工运维阶段,所有的运维问题基本靠人工操作完成,系统管理员通常身兼多职;其次是脚本工具阶段,在各种自动化脚本产生后,大量重复繁琐的运维操作转化为脚本来实现,提高了运维效率;随着微服务、容器技术的兴起及 DevOps 的出现,运维脚本实现的各流程被有机地串39联了起来,运维技术迎来了流程与工具阶段;当前伴随着大数据、计算机算力、人工智能的发展运维技术发展到了智能运维阶段,智能运维技术利用监控、分析和自愈机制来预测和解决问题,使运维工作更加高效、可靠真
44、正实现了闭环的运维智能化。中国移动一直致力于探索人工智能新技术与运维服务的结合与创新,旨在优化运维服务的工作模式,提升运维服务的准确性及效率性。4.2.2 大型语言模型对运维服务的赋能大型语言模型,如 GPT-3.5,不仅具备卓越的自然语言处理能力,还具备广泛的应用潜力,其中之一就是对运维领域的赋能:辅助类的赋能:大型语言模型可以为运维团队提供强大的工具和资源,帮助他们更快速地解决问题。通过与模型交互,运维人员可以获取实时建议、诊断问题、制定解决方案。这种辅助类的赋能可以大大提高运维效率,减少系统故障对业务的影响。其次,大语言模型可以自动生成运维文档、操作手册和故障排除指南,减少了人工编写文档
45、的工作量,提升了文档的质量和准确性。颠覆类的赋能:大型语言模型不仅可以辅助运维,还可以颠覆运维领域的传统方式。它可以利用自然语言理解和生成能力,建立自动化的运维对话系统,使系统管理员和终端用户能够通过自然语言与系统进行交互,完成常见的运维任务。这种形式的运维赋能了非技术人员,降低了运维门槛,使更多人能够参与到运维工作中,提高了业务团队和技术团队之间的协作效率。同时作为他还能与传统的智能运维40平台相结合,用于分析海量的日志、监控数据和故障报告,发现潜在问题的模式,相比于智能运维在文本类问题的处理中有更高的准确性,有助于减少维护成本和提高系统的可用性。从目前情况来看,大型语言模型作为自然语言处理
46、领域的顶尖成果,虽然对文本处理效果极佳。但是在数理分析,调用链分析等领域仍然有待进步,也正因如此,在实际应用中,也更多地采用传统 AI 算法+大型语言模型共同赋能运维场景的方式,这也在越来越多的场景中被证明比采用单一方法有更好的效果。4.2.3 大型语言模型运维服务的应用场景目前,大型语言模型与运维领域的结合已经逐渐成为现实。这些强大的自然语言处理模型不仅在文本理解和生成方面表现出色,还在自动化运维、故障检测和决策支持等关键运维任务中发挥着越来越重要的作用。中国移动也正在积极探索如何将这些模型应用于实际运维工作中,以提高效率、减少故障时间,并更好地管理复杂的 IT 基础设施。41图 21 大模
47、型运维应用场景如图 21,主要展示传统的 AI 算法与大语言模型共同赋能运维场景,核心的 AI 算法平台以及大语言模型平台,在数据采集组件的支撑下,利用特征提取,微调等方法完成数据分析,并强化算法能力,让通用领域大模型具备运维领域的专业知识。并借助 prompt 管理等工程化方法向上支撑大语言能力中心,大语言模型中心作为能力中台支撑供各个业务场景调用。从而实现数据到模型再到业务应用的能力落地,使得大语言模型的能力在故障自愈、调用链路诊断分析、网络故障诊断、日志分析、告警分析等运维场景得以充分地利用。4.2.4 大型语言模型运维应用愿景大型语言模型在运维领域拥有令人兴奋的潜在价值。它们不仅能42
48、够提高运维效率,还可以在系统可靠性和用户体验方面取得显著突破。这些模型的融合将对未来运维技术带来深远影响,因为它们可以自动化故障检测、实现智能修复、优化资源管理,并提供更智能、响应迅速的用户支持。后续,中国移动将持续开展大语言模型在运维服务领域的探索及应用创新。这包括开发更高级的自动化故障诊断和修复系统,优化自动化运维流程,提高自然语言界面的智能水平,以及深化大型语言模型在文档生成和用户支持方面的应用。此外,大型语言模型的安全性和可解释性也需要得到更多关注,以确保它们在运维领域的广泛应用。展望未来,我们可以期待更强大的运维技术,更高效的系统管理,以及更出色的用户支持体验。大型语言模型将成为运维
49、领域的关键推动者,为企业和组织的数字化转型提供坚实支持。通过深化研究合作,我们将能够实现更多创新,将这些潜力变为现实,为未来的运维技术开辟新的前景。4305典型实践445.1.1 项目背景按照国家发改委颁布的新型智慧城市顶层设计指南提出的“公共服务便捷化、城市治理精细化、生活环境宜居化、网络安全长效化”等规划要求,此县通过新一代信息技术与城市建设深度融合、迭代演进,实现此县经济、产业、环境协调发展的新生态,奋力开创新时代全面建设经济、美丽、平安、智慧的新局面。此县智慧城市项目建设内容可概括为“1 朵云+1 中心+1 平台+1统一门户+N 应用”,1 个县级智慧城市管理运营指挥中心,包括指挥中心
50、装修、LED 大屏及 IT 基础设施;1 个县级智慧城市项目城市管理平台,包括城市物联网平台、数据平台、治理协同平台、综合展示应用平台;16 应用包含智慧停车、智慧园区、智慧社区、智慧城市项目APP、智慧环卫、智慧市容市貌、智慧工地、产业及招商服务、智慧执法、智慧政务、智慧应急、智慧消防、智慧党建、智慧发改、智慧环保、智慧河道等。5.1.2 维护内容针对项目运行过程中所涉及的组织机构、制度规范、IT 资产、信息安全、运行维护等进行管理,有效地融合组织、制度、流程和技术,制定和完善相应的管理制度,实施规范和专业化管理,落实运行维护费用,使运行维护管理体系成为日常工作的重要组成部分,并通过持45续