1、运维管理制度XXXXXX有限公司5月18日目 录引言11、总则22、编制办法23、运维部工作职责23.1系统运维和技术支持23.2.平台信息和技术安全34、运维服务管理体系44.1运维服务管理对象44.2 运维系统功能框架44.3运维管理组织构造54.3.1项目负责人54.3.2项目经理54.3.3技术主管64.3.4服务台64.3.5网络管理员74.3.5应用、数据库管理员74.3.7终端管理员74.4运维服务流程84.4.1项目运维服务工作流程图94.4.2服务台94.4.3事件管理104.4.4工单管理104.4.5问题管理104.4.6变更管理104.4.7配备管理114.4.8知识库
2、管理114.4.9记录及工作报告115、运维服务内容115.1服务目的115.2IT资产记录服务125.3网络、安全系统运维服务125.4主机、存储系统运维服务135.5数据库系统运维服务135.6中间件运维服务145.7终端、外设运维服务146、应急服务响应办法146.1应急预案实行基本流程156.2突发事件应急方略157、服务管理制度规范167.1服务时间167.2 行为规范16引言本文献是根据XXXXXX系统协同管理及数据互换方略研究分任务规定,完毕“运维制度”研究工作。课题组参照国际国内原则有:ITIL/ISO0原则GBT 28827.1- 信息技术服务 运营维护 第1某些:通用规定G
3、BT 28827.2- 信息技术服务 运营维护 第2某些:交付规范GBT 28827.3- 信息技术服务 运营维护 第3某些:应急响应规范结合XXX课题应用实行及运维管理实际状况研究、编制运营维护管理制度,本文分为7章内容分别为:1.总则2.编制办法3.运维部工作职责4.运维服务管理体系5.运维服务内容6.应急服务响应办法7.服务管理制度规范等内容。1、总则第一条 为保障XXXX课题信息系统软硬件设备良好运营,使参加课题技术人员运维工作制度化、流程化、规范化,特制定本制度。第二条 运维管理工作总体目的:立足主线促发展,开拓运维新局面。在办公系统运营推广时期,通过网络、桌面、系统等运维,增进XX
4、XX课题可以稳定可持续性发展。第三条 运维管理制度合用范畴:本项目运维全体人员。2、编制办法本实行细则涉及运维服务全生命周期管理办法、管理原则/规范、管理模式、管理支撑工具、管理对象以及基于流程管理办法。本实行细则以ITIL/ISO0为基本,以信息化项目运维为目的,以管理支撑工具为手段,以流程化、规范化、原则化管理为办法,以全生命周期PDCA循环为提高途径,体现了对运维服务全过程体系化管理。3、运维部工作职责3.1系统运维和技术支持(1)依照示范工程实行推动和发展目的,负责系统信息协同管理及协同数据互换方略研究整体架构、应用系统等技术开发方案制定和组织开发,保障基本研发平台稳定性和先进性。(2
5、)负责系统基本研发平台使用培训和操作使用指南编写,对顾客使用过程中浮现问题沟通和解决;(3)会同项目实行单位,确认系统信息基本研发设备和软件数量、品牌规格、技术参数,保证课题有效推动实行。(4)系统信息基本研发设备和软件操作规程和应用管理制度制定,并负责监督执行。(5)系统信息基本研发中心设备和软件安装、调试和验收,使用培训和维修保养。(6)系统信息基本研发平台寻常运营过程中信息安全和技术问题协调解决,保障网站24小时安全稳定运营。(7)负责研发平台系统管理及设备保密口令设立和保存,保密口令设立后报课题领导小组备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。(8)负责系统信息协
6、同管理及协同数据互换方略研究新程序、新系统和软件改版升级工作。3.2.平台信息和技术安全(1)执行国家关于网络信息技术安全法律法规,与通信管理和网络安全监管部门联系,及时解决基本研发平台信息技术安全面存在问题,保证平台安全、稳定、可靠运营。(2)基本研发平台信息技术安全保密制度和工作流程制定,贯彻信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”原则,责任到人。(3)在服务器和计算机之间设立硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,保证基本研发平台不受病毒和黑客袭击。(4)负责基本研发平台信息技术安全应急解决预案制定和实行。(5)建立多机备份基本平台信息
7、服务系统机制,一旦主系统遇到故障或受到袭击导致不能正常运营,可以在最短时间内替代主系统提供服务。(6)建立基本平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设立共享数据库信息访问权限,并设立密码。不同操作人员设定不同顾客名,且定期更换,禁止操作人员泄漏密码。4、运维服务管理体系运维服务管理体系规定了运维工作涉及各类实体,以及这些实体间互有关系。有关实体按照运维服务管理体系进行有机组织,并协调工作,按照服务合同规定提供不同级别IT运维服务。4.1运维服务管理对象运维服务管理对象涉及基本设施、应用系统、顾客、供应商、以及IT运维部门和人员,详细内容如下
8、:(1)基本设施涉及网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等。(2)应用系统涉及OA办公信息系统、门户网站等应用系统等。(3)顾客涉及使用如上应用系统顾客。(4)供应商涉及基本设施和应用系统供应商以及IT运维服务供应商。(5)运维部门和人员涉及内部参加运维活动有关部门和人员,以及提供运维服务公司和有关人员。4.2 运维系统功能框架依照建设单位系统构造和业务开展需要,运维项目组将项目维护框架分为9个详细构成某些,分别为:服务台、时间管理。工单管理、问题管理、变更管理、配备管理、工程师考核、知识库管理、记录、系统管理等9个子项。而详细运维流程将以此为根据开展工作。4.
9、3运维管理组织构造运维项目运维管理构造位三层模式,详细如下图所示。由项目负责人与甲方进行业务范畴接洽,并将沟通成果向下传递。项目经理负责项目整体运维工作,涉及各种制度制定和实行。运维工程师则在项目经理指引下开展维护工作。4.3.1项目负责人职责:负责项目商务、整体协调事宜。职位描述:1、整体负责建设单位运维项目服务筹划制定,领导项目经理并安排项目工作,指引项目经理完毕详细维护工作,每周听取项目经理工作报告,负责考核项目经理工作完毕状况。2、协助建设单位完毕新增项目调研、方案设计并指引项目经理进行详细实行。4.3.2项目经理职责:规划、执行、完善信息化项目运维工作,指引网络、数据库维护工程师开展
10、工作。职位描述:1、依照公司战略目的,指引下属工程师开展客户服务工作,保证运维工作可以满足客户实际需要;2、建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中浮现特殊问题;3、规划并提高运维工程师专业服务能力,在整体上提高客户满意度;4、制定和持续完善绩效考核体系;5、制定整顿运维项目应急预案系统,并指引运维工程师实行;6、提高自身专业技能,在业务方面予以网络管理员和数据库管理员指引。4.3.3技术主管职责:应用、国产数据库管理,数据库性能调优,实现应用负载均衡。职位描述:1. 技术主管非项目常驻人员,依照项目需要进行专业方面指引;2. 负责数据库性能分析与调优,数据库运营状态监控,
11、及时发现异常并迅速解决。3. 纯熟掌握国产数据库技术,可以实现布置及调优。4. 掌握国产中间件工作原理,可以实现布置调优及故障解决。5. 纯熟掌握linux操作系统,布置国产数据库。纯熟掌国产数据库冗灾、数据保护、故障恢复技术。6. 负责应用负载均衡布置和调试。7. 负责指引数据库工程师管理员开展工作。4.3.4服务台职责:故障电话受理,文档管理。职位描述1. 负责业务救济电话受理工作;2. 故障解决发起人,同步进行维护工程师指派,跟踪事件解决状态;3. 进行维护故障记录、顾客满意度记录、工作报表输出等工作;4. 协助项目经理,进行文档整顿、归类、保存等工作。4.3.5网络管理员职责:维护建设
12、单位网络系统正常,解决网络有关故障。职位描述:1、对既有服务器、局域网络及机房、配线间寻常管理维护;2、对信息安全建设提出有关建议,保证网络安全;3、保证外网光纤线路正常,保证局域网运营正常;4、对网络系统和网络设备运营状态进行监控;5、纯熟掌握域方略设立、DHCP、DNS、FTP服务器、NTFS权限设立等;6、编写网络某些应用解决预案并实行。7、工作认真、细致,积极积极有条理性,具备良好沟通能力及团队合伙精神.4.3.5应用、数据库管理员职责:维护建设单位业务系统运营正常,解决应用和数据库故障。职位描述:1、监测业务系统运营状况,应用、数据库性能监视及优化,作必要调节;2、规划不同数据生命周
13、期,制定备份、恢复、迁移和灾备方略,依照业务需要执行数据转换及迁移等操作;3、保证应用和数据库系统安全性、完整性和运营效率。4、负责数据库平台整体架构及解决方案制定和实行;5、工作认真、细致,积极积极有条理性,具备良好沟通能力及团队合伙精神.4.3.7终端管理员职责:维护建设单位桌面系统运营正常,解决终端、外设故障。职位描述:1、各部门电脑、打印机、传真机维护;2、对各部门职工进行电脑有关技术支持及培训工作;3、精通中标Linux及金山WPS办公软件使用,可以纯熟使用MS Windows XP ;MS Office软件,可以制作相应教程对其她部门员工进行培训4.4运维服务流程IT运维服务管理流
14、程涉及服务台、事件管理、问题管理、配备管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动不断进一步和持续改进,其她流程也许会逐渐独立并规范。 4.4.1项目运维服务工作流程图4.4.2服务台服务台是支持运维服务核心功能,与各个流程联系密切。所有管理流程都要通过服务台为顾客提供单点联系,解答顾客有关问题和需求,或为顾客谋求相应支持人员。 在本系统中,服务台是接受各种来源服务祈求和有关信息反馈唯一入口和出口,同步服务台还负责普通祈求、通过知识库(历史事件)可以解决祈求;她也是复杂问题二线解决桥梁。4.4.3事件管理事件管理流
15、程重要目的是尽快恢复服务提供并减少其对业务不利影响,尽量保证最佳服务质量和可用性级别。事件管理流程普通涉及事件侦测和记录、事件分类和支持、事件调查和诊断、事件解决和恢复以及事件关闭。本系统把所有服务祈求和报警归结为事件。事件管理是提供服务台和事件管理者对于事件记录、解决、查询、审核、派发等功能。它也涉及通过和第三方监控系统对接,把其发送报警形成事件功能。4.4.4工单管理工单管理:工单是现场运维、二线支持任务载体,运维工程根据所接受工单进行运维工作。工单管理是对工单实现创立、变更、查询浏览、派发、监督等功能模块。4.4.5问题管理问题管理流程重要目的是防止问题和事故再次发生,并将未能解决事件影
16、响减少到最小。问题管理流程涉及诊断事件主线因素和拟定问题解决方案所需要活动,通过适当控制过程,特别是变更管理和发布管理,负责保证解决方案实行。问题管理还将维护关于问题、应急方案和解决方案信息。问题管理是针对已解决事件遗留问题或解决事件方案只是治标不治本不能彻底解决问题而考虑模块。依照事件、及解决方案,问题解决人通过调查、诊断并提出最后解决办法。4.4.6变更管理变更管理实现所有基本设施和应用系统变更,变更管理应记录并对所有规定变更进行分类,应评估变更祈求风险、影响和业务收益。其重要目的是以对服务最小干扰实既有益变更。变更管理是要对重大资源新增、变更、升级等运维活动进行审核功能,以免这些活动对既
17、有资源可用性导致没有必要影响和破坏;同步,她还要实当前工单中产生变化进行后审计功能。4.4.7配备管理配备管理流程负责核算基本设施和应用系统中实行变更以及配备项之间关系与否已经被对的记录下来;保证配备管理数据库可以精确地反映现存配备项实际版本状态。 配备管理事实上是所有资源统一管理功能,涉及资源整个生命周期参数或配备变化记录管理。管理信息重要涉及分类、型号、版本、位置,状态、有关资料等基本信息还涉及核心参数等 4.4.8知识库管理知识库管理:知识库是提供应运维人员重要技术资料内容,她汇集在工作遇到典型案例归纳总结知识要点和全面实用资料手册。在本系统中,知识库管理提供便于使用人机接口、迅速查询技
18、术手段和维护手段。4.4.9记录及工作报告运维管理系统提供一线解决率记录、客户满意度记录、按分类事件汇总记录、工作报告生成功能,按照一定格式依照事件数据、工单数据、问题数据、配备数据、变更数据可以协助运维管理者能把运维所做工作内容清晰罗列出来。5、运维服务内容5.1服务目的运维项目组提供运营维护服务涉及,信息系统有关主机设备、操作系统、数据库和存储设备运营维护服务,保证顾客既有信息系统正常运营,减少整体管理成本,提高网络信息系统整体服务水平。同步依照寻常维护数据和记录,提供顾客信息系统整体建设规划和建议,更好为顾客信息化发展提供有力保障。顾客信息系统构成重要可分为两类:硬件设备和软件系统。硬件
19、设备涉及网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。服务项目范畴覆盖信息系统资源如下方面核心状态及参数指标: 运营状态、故障状况 配备信息 可用性状况及健康状况性能指标5.2IT资产记录服务服务内容涉及: 硬件设备型号、数量、版本等信息记录记录 软件产品型号、版本和补丁等信息记录记录 网络构造、网络路由、网络IP地址记录记录 综合布线系统构造图绘制 其他附属设备记录记录5.3网络、安全系统运维服务从网络连通性、网络性能、网络监控管理三个方面实现对网络系统运维管理。 设备基本性能检测:CPU、内存使用状况监测
20、; 设备日记查看; 设备SNMP状态; 测试Ping,tracert等工具连通性; 网络安全方略应用与否正常; Internet带宽流量实时监测; 网络拓扑链路状态监测; 异常网络数据包流量; Dos、ddos等网络袭击状况监测; Internet线路误码率、丢包率监测;5.4主机、存储系统运维服务提供主机、存储系统运维服务涉及:主机、存储设备寻常监控,设备运营状态监控,故障解决,操作系统维护,补丁升级等内容。进行监控管理内容涉及: CPU 性能管理; 内存使用状况管理; 硬盘运用状况管理; 系统进程管理; 主机性能管理; 实时监控主机电源、电扇使用状况及主机机箱内部温度; 监控主机硬盘运营状
21、态; 监控主机网卡、阵列卡等硬件状态; 监控主机HA运营状况; 主机系统文献系统管理; 监控存储互换机设备状态、端口状态、传播速度; 监控备份服务进程、备份状况(起止时间、与否成功、出错告警); 监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题; 对存储性能(如高速缓存、光纤通道等)进行监控。5.5数据库系统运维服务提供数据库运营维护服务是涉及积极数据库性能管理,数据库积极性能管理对系统运维非常重要。通过积极式性能管理可理解数据库寻常运营状态,辨认数据库性能问题发生在什么地方,有针对性地进行性能优化。同步,密切注意数据库系统变化,积极地防止也许发生问题。进行监控管理内容涉及
22、: 数据库基本信息:文献系统、碎片、死锁、CPU占用率较大或时间较长SQL语句。 表空间使用信息监测; 数据库文献I/0读写状况; Session连接数量监控; 数据库监听运营状态监测; 查看每日数据备份、数据同步与否正常; 报警日记监测; 对表和索引进行Analyze,检查表空间碎片; 检测数据库后台进程; 数据库对象空间扩展状况监测;5.6中间件运维服务中间件管理是指对 TongWeb 、等国产中间件寻常维护管理和监控工作,提高对中间件平台事件分析解决能力,保证中间件平台持续稳定运营。中间件监控指标涉及配备信息管理、故障监控、性能监控。 执行线程:监控中间件配备执行线程空闲数量。 JVM内
23、存:JVM内存曲线正常,可以及时进行内存空间回收。 JDBC连接池:连接池初始容量和最大容量应当设立为相等,并且至少等于执行线程数量,以避免在运营过程中创立数据库连接所带来性能消耗。 检查中间件日记文献与否有异常报错 如果有中间件集群配备,需要检查集群配备与否正常。5.7终端、外设运维服务负责对终端PC、笔记本以及工作站操作系统、应用软件和硬件维护,解决使用人员在应用过程中遇到问题并进行简朴培训,完毕打印机等其她外设故障解决工作。6、应急服务响应办法运维项目组制定了详尽应急解决预案,整个流程严谨而有序。但在服务维护过程中,意外状况将难以完全避免。咱们将对项目实行突发风险进行详细分析,并且针对各
24、类突发事件,设计了相应防止与解决办法,同步提供了完整应急解决流程。6.1应急预案实行基本流程已解决扩大应急发现故障启动应急预案,并告知领导按事件流程解决初步鉴定故障恢复联系技术支持解决联系开发人员或厂家工程师现场解决普通事件突发事件 总结,修订应急预案已解决未解决突发事件应急组未解决已解决报告进度报告进度报告增援记录6.2突发事件应急方略(1)值班人员平时应做好应急事件监控工作,对于突发事件应认真分析、精确鉴定故障发生数据域,负责跟踪该事件直至其结束。对于不在运维中心故障,应在第一时间内告知负责人去现场解决,密切关注事件流程及进展状况,并做好登记工作上报领导。(2)正常状况下,规定值班人员在1
25、0分钟内进行事件确认。如果属于普通事件则按照事件流程进行分派解决,否则应迅速启动应急预案,并严格按照应急预案所规定环节迅速实行应急处置,及时报告上级领导,掌握实时解决状况。(3)在解决过程中,如需其她部门去现场增援解决,应及时向上级领导部门报告,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助解决。7、服务管理制度规范7.1服务时间(1) 在5*8 小时工作时间内设立由专人职守热线电话,接听内部服务祈求,并记录服务台事件解决成果。(2) 在非工作时间设立有专人7*24 小时接听移动电话热线,用于解决内部技术问题以及接听7*24 小时机房监控人员机房突发状况报告。(3) 服务响应时间:故障
26、级别响应时间故障解决时间I级:属于紧急问题;其详细现象为:系统崩溃导致业务停止、数据丢失。10分钟,30分钟内提交故障解决方案3小时以内II级:属于严重问题;其详细现象为:浮现某些部件失效、系统性能下降但能正常运营,不影响正常业务运作。10分钟,30分钟内提交故障解决方案6小时以内III级:属于较严重问题;其详细现象为:浮现系统报错或警告,但业务系统能继续运营且性能不受影响。10分钟,30分钟内提交故障解决方案12小时以内IV级:属于普通问题;其详细现象为:系统技术功能、安装或配备征询,或其她显然不影响业务预约服务。10分钟,2小时内提交故障解决方案24小时以内7.2 行为规范 (1) 遵守顾客各项规章制度,严格按照顾客相应规章制度办事。(2)与顾客运营维护体系其她部门和环节协同工作,密切配合,共同开展技术支持工作。(3)浮现疑难技术、业务问题和重大紧急状况时,及时向负责人报告。(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄严。接听电话时要文明礼貌,语言清晰明了,语调和善。(5)遵守保密原则。对被支持单位网络、主机、系统软件、应用软件等密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。