收藏 分销(赏)

南京化工园数据中心运维管理规范-v11_final.docx

上传人:xrp****65 文档编号:6179033 上传时间:2024-11-29 格式:DOCX 页数:73 大小:1.93MB 下载积分:10 金币
下载 相关 举报
南京化工园数据中心运维管理规范-v11_final.docx_第1页
第1页 / 共73页
南京化工园数据中心运维管理规范-v11_final.docx_第2页
第2页 / 共73页


点击查看更多>>
资源描述
南京化学工业园 数据中心运维方案 华存数据信息技术有限公司 2014年9月 文档版本信息(仅仅包含关键版本信息): 文档编写 文档审阅 / 验证 文档状态 公司/部门 人员 版本 时间 公司/部门 人员 版本状态 华存数据 毛鹏飞/苏本海 V0.1 2014年9月15日 华存/系统服务部 吴庆忠 草案(D) 审阅(R) 验证(V) 废止(E) 华存数据 苏本海/于翔 V0.5 2014年9月28日 华存/系统服务部 毛鹏飞 草案(D) 审阅(R) 验证(V) 废止(E) 华存数据 苏本海/于翔 V1.0 2014年10月4日 华存/销售部 闫丽萍 草案(D) 审阅(R) 验证(V) 废止(E) 华存数据 苏本海/于翔 V1.1 2014年10月8日 华存/销售部 闫丽萍 草案(D) 审阅(R) 验证(V) 废止(E) 草案(Draft): 文档编写完毕,但未经审阅或未通过审阅。 审阅(Reviewed): 已经通过审阅,但未经实际操作验证。如审阅发现有误,则置为草案状态。 验证(Verified): 已经通过审阅并经实际操作验证无误。如验证发现有误,则置为草案状态。 废止(Extinction): 不再有效或继续使用,则置为废止状态。 目 录 1. 总则 6 2. 数据中心运维原则及目标 6 2.1 数据中心运维原则 7 2.1.1 合规性 7 2.1.2 可用性 7 2.1.3 安全性 8 2.1.4 经济性 8 2.2 数据中心运维目标 8 3 数据中心运维人员、工具及对象 9 3.1 数据中心运维人员 9 3.2 数据中心运维工具 9 3.3 数据中心运维对象 10 3.3.1 基础设施 10 3.3.2 IT设备 10 3.3.3 数据与应用 10 4 数据中心日常运维内容 11 4.1 基础设施 11 4.1.1 基础环境设施运维内容 11 4.1.2 基础设备设施运维内容 12 4.1.3 基础安全设施运维内容 13 4.2 IT设备 14 4.2.1 服务器设备运维内容 14 4.2.2 存储设备运维内容 15 4.2.3 网络设备运维内容 16 4.2.4 其他设备运维内容 16 4.3 数据与应用 16 4.3.1 数据库运维内容 17 4.3.2 应用系统运维内容 18 5 南京化工园数据中心运维规范及制度 18 5.1 机房设施设备命名规范 18 5.1.1 机房标识标准总则 18 5.1.2 机房图示 19 5.1.3 设备标识规范 20 5.1.4 机房规范准则 24 5.1.5 范围及职责 27 5.1.6 信息资产的分类 27 5.1.7 信息资产的管理 28 5.2 机房出入管理制度 28 5.3 设备操作行为规范 29 5.4 巡检制度 29 5.5 请示报告制度 30 5.6 维护资料管理制度 31 5.7 运行维护考核制度 31 5.8 保密制度 32 5.9 数据中心安全制度 32 6 数据中心运维管理流程 34 6.1 健康巡检流程 34 6.2 日常维护流程 35 6.3 故障处理流程 36 6.4 应急处理流程 37 6.5 事件管理流程 38 6.6 问题管理流程 40 6.7 变更管理流程 42 6.8 配置管理流程 43 6.9 发布管理流程 44 6.10 服务报告流程 45 7. 服务报告模板 45 7.1 运维服务周报 45 7.1.1 总体情况 46 7.1.2 运行情况 47 7.1.3 故障监控情况 50 7.1.4 存储使用情况 51 7.1.5 维护情况 51 7.2 运维服务月度报告 53 7.2.1 总体情况 53 7.2.2 软件情况 54 7.2.3 硬件情况 55 7.3 运行情况 55 7.3.1 运行监控情况 55 7.3.2 备份系统运行情况 58 7.3.3 故障监控情况 58 7.3.4 存储使用情况 59 7.4 维护情况 59 7.4.1 维护工作 59 7.4.2 参会情况 60 7.4.3 其他工作 60 7.4.4 下月工作计划 61 7.4.5 对后续工作的建议 61 7.4.6 需要协调与明确的事宜 61 7.5 运维服务年度汇报报告 61 7.5.1 20xx年工作完成情况 62 7.5.2 主要运行指标 62 7.5.3 投运退役情况 62 7.5.4 数据信息安全(备份,防火墙策略等) 63 7.5.5 故障情况 63 7.5.6 维修情况(硬件损坏) 63 7.5.7 专项工作 63 7.6 故障处理服务报告 64 7.6.1 南京化学工业园区故障处理服务报告 64 7.7 设备巡检服务报告 66 7.7.1 存储设备巡检报告 66 7.7.2 VMware虚拟机巡检报告 69 7.7.3 Linux数据库巡检报告 70 7.7.4 网络巡检报告 72 7.7.5 消防监控设备巡检报告 73 7.8 运维工作年终总结 73 7.9 用户对本年度的工作评价及反馈 73 1. 总则 南京化工园的运维管理规范是以ITIL/ISO20000为基础,参考现代化数据中心运维的成功案例并合南京化工园数据中心的特点,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,来实现对南京化工园数据中心运维服务全过程的体系化管理。运维及管理架构图如下所示: 南京化工园数据中心IT的运维服务管理主要分为:服务管理、对象管理、流程管理等三个部分。分别如下: n 服务管理:主要包括:策划、执行、监视、改进四个步骤。 n 对象管理:主要包括:基础设施、IT设备、操作系统、DB及业务等4个部分。 n 流程管理:主要包括:健康巡检流程、日常维护流程、故障处理流程、应急处理流程、事件处理流程、问题管理流程、配置管理流程、变更管理流程、发布管理流程、服务报告流程等几个部分。 2. 数据中心运维原则及目标 从数据中心角度来看,数据中心运维管理就是:为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维是数据中心生命周期中最后一个、也是历时最长的一个阶段。所谓生产运维期指的是从数据中心项目交付使用,直到项目废除的全过程,也就是项目进行生产运维活动,收回投资,以实现预期投资目标的周期。在此阶段的运维管理,将依托于数据中心已交付的基础设施,通过科学的管理,最终使数据中心得以实现服务与经济上的目标。简单地说,运维管理就是用好、管好已建设交付的数据中心。因此,在数据中心生命周期中,运维管理主要肩负起以下重要目标:合规性、可用性、经济性、安全性四大目标。 所以针对南京化工园数据中心的运维原则及目标如下: 2.1 数据中心运维原则 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最长的一个,同时也是最重要的一个阶段。所以此次针对南京化工园数据中心的运维应该满足以下运维原则: 2.1.1 合规性 数据中心运营的关键是要向外提供各种各样的数据及业务服务,这就要求数据中心在运维管理过程中遵循相应的法律、法规、标准与合约文件等规定。所以数据中心运维的关键任务就是在充分考虑有关文件的要求下向外提供持续、稳定的业务服务。同时数据中心的运维必须进行合理的规划,不断引入新的技术,新的服务形式,跟随信息技术变革的潮流,源源不断地提供越来越丰富的服务,以满足业务要求为指导理念来提供高效合理的运维服务,从而让数据中心持续保持旺盛的生命力。 2.1.2 可用性 南京化工园数据中心运维的根本目标就是保障数据中心业务的可用性,持续的为最终用户提供各种各样的数据及业务服务,所以针对南京化工园数据中心运维规范是以数据中心的可用性为基础来进行制定的。因此,它要求数据中心在运维管理过程中能准确识别相关功能组件,了解该组件的设计能力,定义与该组件技术特点相匹配的监控指标,并通过主动与被动的管理,最大限度地保证数据中心各管理组件的可用性。 2.1.3 安全性 安全是数据中心运维中最重要的原则之一,在日常运维管理中,我们需要做足预防工作,确保无安全隐患存在,如,确保业务的健壮性、安全性、可靠性、稳定性、高可用性,用以保证业务的持续、安全的运行。因此,此次针对南京化工园数据中心的运维,安全性方面也是需要重点考虑的一项指标。 2.1.4 经济性 随着数据业务的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在逐步加大,因此在数据中心运维方面的投入也需要逐步进行增加。运维工作作为数据中心生命周期中最长、最重要的一项任务,要通过合理的分析,找出成本控制的相应措施,从而实现低投入,高收入的数据中心运营模式。  2.2 数据中心运维目标 数据中心运维是指对机房基础设施、IT设备、信息系统与相关的应用组件等的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高业务系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。 通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划,从而实现业务高效、稳定运行的目标。 针对南京化工园的运维目标可大概总结如下: n 对现有的信息系统基础资源进行监控和管理; n 及时掌握各信息系统资源现状和配置信息; n 及时掌控信息系统资源的可用性情况和健康状况; n 创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。 n 逐步实现南京化工园数据中心规范化、流程化、制度化的运维策略; 3 数据中心运维人员、工具及对象 为了保证用户现有的信息系统的正常运行,降低整体管理成本,提高南京化工园数据中心的整体服务水平,同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。因此针对南京化工园数据中心状况,需要有专业的数据中心运维人员,辅以合适的管理工具,来对数据中心进行运维,其运维对象主要包括基础设施、IT设备、数据与应用等几个部分,如下图所示: 3.1 数据中心运维人员 针对南京化工园数据中心运维项目,相关运维人员如下: 南京化工园运维人员组织架构 公司 姓名 项目职责 邮箱 电话 备注 华存数据 沈 伟 销售总监 shenwei@ 13851490382   华存数据 闫丽萍 销售经理 yanlp@ 13813854344   华存数据 吴庆忠 服务总经理 wqzhong@ 18621931973   华存数据 宋野 南京区域项目经理 songy@ 18651836325   华存数据 苏本海 项目经理 subh@ 18621668080   华存数据 于翔 运维工程师 yux@ 18651906212   华存数据 史翔龙 运维工程师 shixl@ 15651972296   3.2 数据中心运维工具 针对南京化工园的数据中心运维,我们将利用现有的软硬件监控软件来帮忙实现及时准确的故障监控,依赖软件如下: n 贝塔软件 n 环空软件 n 大屏监控系统 n 呼叫中心服务系统 因为当前监控软件功能尚不完善,功能相对也较为有限,我们建议后续逐步对监控软件功能进行完善,从而辅助运维工程师,实现及时、准确、稳定的现代化运维。 3.3 数据中心运维对象 3.3.1 基础设施 基础设施是指为保障南京化工园数据中心正常运行所需风火水电等环境设施,它是数据中心硬件设备的基础,所以也是我们运维的目标之一。主要包括以下几个部分: n 基础环境设施 n 基础设备设施 n 基础安全设施 3.3.2 IT设备 IT设备是指在提供IT服务过程中所应用的各种设备,如服务器设备、存储设备、网络设备、安全设备等。这些设备是IT服务过程中提供计算、存储、通信等功能的基础,是IT服务最直接的物理载体,所以是我们本次运维的核心目标之一。主要包括以下设备: n 服务器设备 n 存储设备 n 网络设备 n 其他设备 3.3.3 数据与应用 数据与应用,包括数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等,它们是IT服务的逻辑载体,是保障也正常运行最直接的因素。也是南京化工园数据中心运维最为关键的对象之一,大体可以分为以下几个主要部分: n Oracle 数据库 n SQL数据库 n B/S架构应用 n C/S架构应用 4 数据中心日常运维内容 数据中心是企业IT运营的依托主体,没有数据中心内的软硬件系统就无法实现南京化工园的IT服务能力,因此保障数据中心内基础环境及各软硬件系统的正常运营就成为了现代化IT运维的跟本任务。 南京化工园数据中心运维的基本任务就是对数据中心设备、系统、软件进行日常的管理、优化及维护,以确保及时排除隐患,及时优化及完善,来确保南京化工园业务的连续性。具体运维内容如下: 4.1 基础设施 为保证机房内所有设备的安全、稳定、无故障运行,我们需要监控机房的环境、监测并定期检查电源、通风、接地等所有机房设施的工作状态,发现并报告问题和提出变更建议。 4.1.1 基础环境设施运维内容 针对南京化工园基础环境设施的运维内容如下: l 机房温度检查 n 检查机房平均温度情况,确保温度在10℃-40℃之间,一般温度控制在20℃左右,(如有过高或过低情况,需及时汇报并作出调整)。 n 抽查机房局部温度情况,确保无过冷或过热点(一般抽查对象为机房角落及大功率设备附件)。 l 机房湿度检查 n 检查机房湿度情况,确保机房湿度符合环控设施对湿度的定义,这里既不能过湿又不能过于干燥。 n 确保机房内有抽湿或加湿设备,能对机房湿度进行及时调整。 l 机房卫生检查 n 检查机房整洁情况,确保机房无杂物堆放(机房里不应堆放杂物,建议设立建立储物间来堆放杂物)。 n 确保机房地面整洁。 n 确保进入机房有专用鞋套供应。 n 确保机房内通道畅通,设备安放位置不应阻碍交通,不应对机柜设备调整造成影响。 l 机房照明检查 n 检查机房照明系统,确保机房照明系统正常,这里一般建议照明系统与UPS互相独立。 n 检查机房的应急照明系统,确保机房应急照明系统可以正常工作,并且不应有照明盲区。 4.1.2 基础设备设施运维内容 针对南京化工园基础设备设施的运维内容如下: l 机房空调检查 n 检查机房空调运行状态,确保机空调运行正常。 n 听空调电机有无异响,如有异响需及时报销。 n 检查机房备用空调运行状态,确保备用空调正常可用。 n 检查空调参数设置,确保空调设置正常。 n 检查空调温度设置,确保空调温度设置适中。 n 检查空调送风情况,确保空调出风正常,送风距离符合设置要求,出风口前无障碍物。 n 检查空调排水情况,确保排水正常,无漏水等现象。 n 记录巡检结果。 l 机房UPS检查 n 观察UPS前面板的指示灯和液晶屏情况,确保UPS设备工作正常。 n 检查UPS输入、输出,电池连接线缆有无发热、氧化情况。 n 测量UPS输入、输出电压,电池组电压,确保电源符合标准误差要求。 n 确保服务器电源输入为一路UPS,一路市电。 n 检查UPS电池充放电情况,确保符合UPS厂商要求。 n 记录巡检结果。 l 机房消防设施检查 n 检查自动消防设备控制器工作状况正常,有无故障或异常告警。 n 检查自动消防设备控制屏是否处于手动禁止、喷洒允许状态。状态不正确则需调整。 n 检查自动消防设备采集感烟探头、感温探头、紧急启停按钮、气体控制模块、气体喷洒指示灯等外围设备工作是否正常 n 检查七氟丙烷自动消防设备灭火剂气瓶压力是否正常 指示针应在绿色范围内,如指示针不在绿色范围内,则压力不正常。灭火剂气瓶安全销是否拔除,铅封签是否完好。若灭火装置工作状态不正常及时联系厂家处理。 n 检查手提式灭火器气瓶,灭火剂是否在有效期,有软管连接的应检查高压软管有无变形、裂纹和老化。每年更换灭火器标签,标明灭火器使用单位、灭火剂种类、检查日期、责任人。 n 记录巡检结果。 l 机房环控设施检查 n 检查机房环控系统设备,确保机房环控系统温度感应系统正常。 n 检查机房环控系统设备,确保机房环控系统湿度感应系统正常。 n 检查机房环控系统状态,确保机房环控系统运行正常。 4.1.3 基础安全设施运维内容 针对南京化工园基础安全设施的运维内容如下: l 机房门禁系统检查 n 检查各接线端子、通讯接口是否有松动现象,外观护罩是否正常,是否可以刷卡。 n 检查机房门禁系统指示灯,确保机房门禁系统可正常运行。 n 检查门状态与监控主机显示是否一致(如不一致,需要进行仔细核查)。 n 检查机房门禁系统,确保机房门禁系统记录保存良好。 l 机房访问登记检查 n 对机房访问登记表进行检查,确保信息完整、记录明确。 n 对机房访问登记表与门禁系统记录进行对比,确保信息一致。 n 对机房访问登记表与监控系统记录进行对比,确保信息一致。 l 机房监控设施检查 n 对机房监控设施进行检查,确保机房监控设施工作正常。 n 对机房监控设施进行检查,确保机房监控设施无盲区。 n 对机房监控设施进行检查,确保监控录像按照要求存储在存储设备内。 n 对录像存储进行检查,确保历史录像记录可播放。 l 机房防鼠检查 n 对机房各个角落进行检查,确保无鼠洞。 l 机房防雷检查 n 对机房防雷接地网的接地电阻进行测量,确保符合规定标准。 n 检查防雷线连接处是否紧固。 n 检查接触是否良好、接地引下线有无锈蚀、接地体附近地面有无异常。 4.2 IT设备 IT设备数据中心运维对象中最关键部分之一,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体,下面将分别对它们的运维内容进行说明。 4.2.1 服务器设备运维内容 服务器设备运维是指从服务器物理硬件状态、线缆连接情况、系统状态等方面对其进行检查,确保服务器运行正常,无安全隐患,其主要运维内容如下: l 硬件状态检查 n 检查服务器硬件状态,确保服务器状态灯正常。 n 检查服务器电源情况,确保电源存在冗余。 l 线缆连接情况检查 n 检查服务器网络连接情况,确保网络线缆连接正常。 n 检查服务器光纤连接情况,确保光纤线缆连接正常,链路存在冗余。 n 检查服务器电源线连接情况,确保双电源线连接正常。 l 系统状态检查 n 检查操作系统日志,确保主机系统运行正常(如遇警告及报错需要及时向上级汇报并及时进行处理)。 n 检查系统版本情况,确保符合官方推荐。 n 系统资源利用率检查-CPU,确保主机工作时间平均CPU利用率低于80%。 n 系统资源利用率检查-内存,确保主机工作时间平均内存利用率低于80%。 n 系统资源利用率检查-网络,确保主机工作时间平均网卡流量利用率低于80%。 n 系统资源利用率检查-硬盘,确保主机内硬盘使用空间低于70%,如果大于70%需要持续关注磁盘空间变化量及时采取相应措施进行调整(如删不用的数据或者扩容)。 n 对于有外挂存储磁盘的系统,检查外挂存储磁盘链路情况,确保链路存在冗余。 4.2.2 存储设备运维内容 存储设备运维是指从存储设备硬件状态、线缆连接情况、系统状态等方面对其进行检查,确保存储运行正常,无安全隐患,其主要运维内容如下: l 硬件状态检查 n 检查存储设备硬件状态,确保存储状态灯正常。 n 检查存储机头及扩展柜电源情况,确保电源存在冗余。 n 检查存储电池状态,确保电池指示灯正常。 l 线缆连接情况检查 n 检查存储内部线缆连接情况,确保存储机头与扩展柜线缆连接正常。 n 检查存储电源线缆连接情况,确保存储机头及系统柜由电池供电。 n 检查存储到光纤交换机线缆连接情况,确保线缆连接正常、链路存在冗余。 l 系统状态检查 n 检查存储状态日志,确保存储系统运行正常(如遇警告及报错需要及时向上级汇报并及时进行处理)。 n 检查存储微码版本情况,确保存储微码符合官方推荐。 n 检查存储cache状态,确保有读写cache可用。 n 使用存储的analyzer功能对存储资源利用率情况进行检查,确保业务高峰期存储资源利用率尚未达到存储系统阀值。 n 对存储电池的充放电情况进行检查,确保存储电池充放电按照存储内设定的计划执行。 n 检查主机链路注册情况,确保主机注册链路均为active状态。 4.2.3 网络设备运维内容 网络设备包括普通网络设备及存储网络设备,网络设备的运维是指从网络设备硬件状态、线缆连接情况、系统状态等方面对其进行检查,确保其运行正常,无安全隐患,其主要运维内容如下: l 硬件状态检查 n 检查各交换机状态指示灯情况,确保交换机状态灯正常。 n 检查交换机端口情况,确保已连接端口状态指示灯正常。 n 检查交换机电源情况,确保核心交换机电源存在冗余(可能部分网络设备电源无冗余)。 l 线缆连接情况检查 n 检查交换机网络连接情况,确保网络线缆连接正常、并且标签明确。 n 检查交换机电源线连接情况,确保交换机电源线连接正常。 l 系统状态检查 n 检查交换机的日志,确保交换机系统运行正常(如遇警告及报错需要及时向上级汇报并及时进行处理)。 n 检查交换机版本,确保版本符合官方推荐,无较大漏洞。 n 检查交换机配置情况,确保交换机配置符合规范推荐。 n 检查交换机各端口的流量情况,确保端口流量尚未达到端口带宽瓶颈。 4.2.4 其他设备运维内容 对于其他设备的运维(如:工控机、安全设备、特殊设备等),我们建议南京化工园根据设备运维规范,并结合设备特点,从设备硬件状态、线缆连接情况、系统运行情况等方面对设备进行日常的运维,以确保该设备能健康、稳定、持续、高效的运行。 4.3 数据与应用   数据与应用的运维,包括数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。它们是IT服务的逻辑载体,对南京化工园持续的IT服务能力起着至关重要的作用,所以,针对该部分的运维内容,我们将分为数据库的运维与应用的运维两个部分来进行说明 。 4.3.1 数据库运维内容 数据库是南京化工园的数据存储仓库,也是业务系统直接的数据交互对象,数据库能否正常运行直接影响着相关业务,数据库的性能直接影响着业务的访问速度。所以,所以对于数据库的运维至关重要,针对南京化工园数据库现状,我们将分为SQL server和Oracle两个部分。 l Oracle数据库的运维内容 n 数据库的版本及补丁检查,确保版本及补丁符合官方推荐,无重大BUG。 n 数据库基本信息配置信息检查,确保数据库配置符合官方最佳实践。 n 检查数据库报警日志,确保数据库无重大警告及错误存在。 n 检查数据库监听状态,确保数据库监听处于可访问状态。 n 检查数据库内SQL语句运行情况,确保无死锁存在。 n 检查SQL语句运行效率,确保SQL语句的高效性。Ø n 检查Oracle数据库表空间使用情况,确保有足够空间扩展。 Ø n 检查数据库文件I/0读写情况,确保无延迟情况。 n 检查Oracle数据库的Session连接数量和状态,确保无非活动session,并且数量符合客户端连接情况。 Ø n 对索引进行分析,确保索引的有效性。 n 对表空间进行碎片检查和分析,确保表空间的高效性。Ø n 查看数据库备份情况,确保数据库有备份存在。 Ø l SQL server数据库的运维内容 n 数据库的版本及补丁检查,确保版本及补丁符合官方推荐,无重大BUG。 n 数据库基本信息配置信息检查,确保数据库配置符合官方最佳实践。 n 检查数据库报警日志,确保数据库无重大警告及错误存在。 n 检查数据库的运行状态,确保数据库的可访问性。 n 检查数据库内SQL语句运行情况,确保SQL语句的高效性。 n 检查SQL server数据库的空间使用情况,确保有足够空间可扩展。 Ø n 检查数据库I/0读写情况,确保无延迟情况。 n 查看数据库备份情况,确保数据库备份按计划执行。 Ø 4.3.2 应用系统运维内容 应用系统是南京化工园最直接的服务对象,它是对南京化工园提供持续业务服务的能力基础,也是此次运维最核心的部分之一。针对南京化工园现状,我们可以将应用分为B/S架构应用和C/S架构应用两个部分。下面将对这两部分运维内容进行分别介绍。 l B/S架构应用 n 检查WEB容器的日志,确保无警告或错误存在。 n 检查B/S服务器的WEB访问端口,确保端口通信正常。 n 检查业务的服务状态,确保业务正常可用。 n 检查应用与数据库的交互情况,确保可用正常通信。 n 检查应用服务器的内存使用情况,确保内存利用率低于80%。 n 检查应用服务器的CPU使用情况,确保CPU利用率低于80%。 n 检查应用服务器的网络使用情况,确保网卡利用率低于80%。 n 检查应用服务器硬盘读写的等待时间,确保磁盘读写等待时间在允许的范围内。 l C/S架构应用 n 检查应用程序的日志,确保无警告或错误存在。 n 检查业务的服务状态,确保业务正常可用。 n 检查应用与数据库的交互情况,确保可用正常通信。 n 检查客户端的连接情况,确保各客户端连接正常。 n 检查应用服务器的内存使用情况,确保内存利用率低于80%。 n 检查应用服务器的CPU使用情况,确保CPU利用率低于80%。 n 检查应用服务器的网络使用情况,确保网卡利用率低于80%。 n 检查应用服务器硬盘读写的等待时间,确保磁盘读写等待时间在允许的范围内。 5 南京化工园数据中心运维规范及制度 5.1 机房设施设备命名规范 5.1.1 机房标识标准总则 1. 编制说明 《南京化学工业园区机房标识标准》(以下简称标识标准)旨在适应南京化学工业园区信息化发展需要,结合其机房内各种应用要求,塑造统一规范的自动化机房标识标准,通过进一步规范公司自动化机柜、设备、线缆等基础设施的标识,提供标准的自动化系统运行环境,缩短故障处理时间,提升信息系统运维服务质量。 2. 编制依据 本标识标准结合南京化学工业园区运行维护实际工作经验进行编制。 在实施过程中,各单位应履行相关责任、权利、义务,按照公司有关文件执行。 3. 适用范围 南京化学工业园区机房设备资源的现场命名及标识应遵照本规范。 5.1.2 机房图示 南京化学工业园区机房应当具有以下机房标识:空间环境标识、走线架标识、面板标识、设备标识、线缆标识等,具体标识如下。 5.1.3 设备标识规范 1. 设备标识 设备标识用于标识设备信息,包含以下信息:设备名称、设备编号、设备型号、运维等级、物理位置、负责人联系方式、IP/掩码、上线时间、条码等,标签形式大体如Table 1-1 XX服务器 设备编号:XXXXXXXXX 设备型号:XXXXXXXXX 业务系统:XXXXX 物理位置:机房编号-6F03-3U 负责人:XXX 联系方式:XXX-XXXX-XXXX IP/Mask:XXXXXXXXXXXX/XX 上线时间:2XXX年XX月 条码: Table 1-1 n 规格:推荐70mmx50mm,长方形,小圆角 n 内容:设备名称参考南京化学工业园区机房设备命名规范; n 设备编号参考南京化学工业园区机房设备编号规范; n 设备型号即厂家设备型号,如Cisco Nexus7000 C7010; n 业务系统参考南京化学工业园区机房系统编号规范; n 物理位置需要标注机房编号,机柜编号,设备在机柜中的起始U数; n 负责人/联系方式需要精确、真实,切勿填写虚假信息; n IP/Mask即设备的管理IP地址及掩码; n 条码为设备的序列号,配合资产管理与巡检工作使用。 n 形式:分为粘贴式和悬挂式两种,两种形式均需带有南京化学工业园字样,可任选其一。 n 粘贴式粘贴标签于设备空白处,如Table 1-2; n 悬挂式悬挂标签于设备左上角机柜架孔,如Table 1-3。 Table 1-2 Table 1-3 2. 线缆标识 线缆标识形式采用直条标签粘贴,标识内容标注对端设备+对端端口 3. 机柜标识 n 编号方式:楼层+机柜号,如6F07机柜。 n 形式:粘贴签,紧贴机柜门把手粘贴于正上方,如Table 1-4。 n 规格:白色标识,长方形,直角。 Table 1-4 4. 配线架标识 n 形式:粘贴签,紧贴配线架端口粘贴于正上方,如Table 1-5。 n 规格:连续端口,中间以虚线相连接 n 备注:标识内容自定义 Table 1-5 5. 空间环境标识 n 形式:粘贴于机房的相应位置,如Table 1-6。 n 规格:根据实际位置定制 n 备注:空间环境标识供选择性使用,但安全出口,灭火器警示为必须使用 Table 1-6 5.1.4 机房规范准则 1. 机房编号规范 南京化学工业园区机房按物理位置编号,具体命名方式为机房(House)缩写H加数字序号。据此,南京化学工业园机房编号如Table 2-1: 南京化学工业园区机房命名规范 序号 机房描述 机房编号 1 南京化学工业园区海关楼6F机房 H1 2 南京化学工业园区海关楼7F机房 H2 3 南京化学工业园区海关楼1F UPS机房 H3 Table 2-1 2. 机房机架编号规范 南京化学工业园区机架编号由如下方式构成:“机房楼层” + “机架序号”,如6F07 机架序号的编号方式为按进机房面向设备方向,从前至后、从左至右从“1”开始依次递增。 3. 机房系统编号规范 南京化学工业园区机房系统按应用系统或者架构平台区分,具体命名方式为数字式。末尾数自左向右从“1” 开始依次递增,首位数自上而下从“1”开始依次递增。据此南京化学工业园区机房系统命名如Table 2-2: 南京化学工业园区机房系统编号规范 序号 系统描述 系统编号 1 网络平台 SYS01 2 服务器存储及备份平台 SYS02 3 统一通讯(语音)系统 SYS03 4 环境监控(UPS、空调、供电)系统 SYS04 5 视频监控系统 SYS05 6 数字会议系统 SYS06 7 消防系统 SYS07 8 其它 SYS09 Table 2-2 4. 机房设备类型命名规范 南京化学工业园区机房设备类型命名方式如Table 2-3: 南京化学工业园区机房设备类型命名规范 序号 设备描述 英文名称 英文缩写 1 交换机 SWITCH SW 2 服务器 SERVER SERV 3 磁盘阵列 storage STOR 4 不间断电源 UninterruptedPower Supply UPS 5 打印机 printer PRT 6 路由器 router ROUT 7 工作站 workstation WS 8 刻录机 CD writer CDR 9 磁带机 tape prive TAPE 10 切换器 KVM KVM 11 防火墙 fire wall FW 12 入侵检测 intrusion petect system IDS Table 2-3 5. 机房设备编号规范 南京化学工业园区机房设备编号由如下方式构成:“设备类型”+“-”+“系统编号”+“-”+数字序号,如:SW-SYS01-001 6. 机房设备命名规范 南京化学工业园区机房设备编号由如下方式构成:“机房编号”+“/”+“机架编号”+“-”+“设备类型”+“-”+“系统编号”+“-”+数字序号,如:H1/6F06-SW-SYS01-001 机房设施设备资产管理 5.1.5 范围及职责 1.本制度适用于南京化学工业园区应急响应中心信息资产的管理。 2.本制度中的信息资产是指可以存储信息数据的信息载体包括硬件、软件、数据(电子数据)、文档(纸质文件)、其他等。 3.资产统计信息的范围包含但不限于资产编号、资产类别、厂商、型号、条形码、责任人、所属部门、物理位置等。 注:资产编号形式:NCIP00001至NCIP99999,依次增加数字编号。 5.1.6 信息资产的分类 1.硬件 (1)计算机设备:(台式机、笔记本)、服务器; (2)存储设备:磁带机、磁盘阵列、磁带、光盘、软盘、移动硬盘、硬盘录像机等; (3)网络设备:路由器、交换机、防火墙、入侵检测等; (4)线缆:光纤、双绞线、电话线(布线)、电源线等; (5)环境设备: UPS、空调、门禁、消防设施等; (6)其他设备,自行标注名称。 2.软件 如操作系统、系统软件(office/AutoCAD)、应用软件、网管软件、杀毒软件、财务软件等,软件名称自行标注。 3.电子数据 各种电子数据资料,如各类管理文档、方案、计划、日周月报告、用户手册、电子设计图纸等。 4.纸质文件 纸质的各种文件。如传真、合同、图纸等。 5.其他,自行标注名称。 5.1.7 信息资产的管理 1.信息资产的接收转移要核对设备清单,对相关设备进行测试验证然后登记。由资产管理员对资产进行管理,明确资产责任人。 2.对敏感数据资产需进行保护措施,在未经相关领导允许情况下严禁借阅、使用。 3.信息资产的保存方式应注意防火、防水、防腐等措施,保证资产安全。 4.信息资产必须明确责任人。 5.要注意信息资产的安全性、机密性、完整性,防止信息载体的毁坏和信息的泄密,对特定信息资产定期进行维护保养,发生毁坏、丢失等问题时能够及时处置。 6.信息资产发生改变需及时更新信息资产文档。附件:《机房设施设备资产管理表》 5.2 机房出入管理制度 为了加强南京化学工业园区机房管理,保障南京化学工业园区数据运行的安全和稳定,本制度适用于人员及设备的出入: 1.机房门禁系统指定专人负责,对门禁卡的发放、收回进行登记。 2.机房工作人员进出机房使用门禁卡,一人一卡制原则,严禁将卡私借他人。 3.谢绝无关人员进入机房;非机房工作人员应征得机房负责人的同意,方可进入机房,并在《机房出入登记表》上进行登记,注明日期、时间、姓名、事由等。进入机房后,必须有机房工作人员陪同,并服从机房工作人员的安排
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 应用文书 > 规章制度

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服