资源描述
目录
1. 监控与维护 2
1.1 监控和分析处理 2
1.2 巡检 3
1.3 交接班 4
1.4 综合检查 5
1.5 周期性统计与分析 6
1.6 备份与还原 7
1.7 清洁与保洁 7
2. 日常管理 8
2.1 物资管理 8
2.2 资料的管理 8
3. 故障处理 9
3.1 故障处理 9
4 客户与业务 10
4.1 客户服务 10
4.2 工单处理 12
5 其他服务项 13
5.1 参观接待 13
5.2 第三方管控 14
5.3 客户发起的业务 15
修改原因
1. 掌握备份的复核周期 添加第6章记录/附录《客户要求登记清单》。
2. 掌握客户要求登记清单的填写要求,能正确指导一线人员填写
1. 监控与维护
1.1 监控和分析处理
a) 视频监控
q 内容:
Ø 浏览视频,查看是否有异常人员;
q 对机房内的客户或第三方人员监控,首先将客户接待至监控室,在监控室做好登记确认,之后由值班人员将客户维护区域的监控视频投放至大屏幕,最后将客户带领至相应的物理位置区域进行监控;
q 要求:
Ø 巡检时遍历所有的视频一次;不能有非相关人员进入机房;
Ø 对在机房内的客户或第三方,要至少5分钟监视一次其工作状态;
Ø 具体要求参见《IDC监控规范》;
q 指标:
Ø 人员操作时,未有专门视频监控数为0;
q 边界:
Ø 覆盖区为机房
Ø 走廊、大厅等公共区域须关注但非我方责任。
b) 网络设备监控
q 内容:
Ø 监控Cacti是否有超阈值(CPU、内存、板卡进出温度、端口流量)的提醒;(有颜色、声音、邮件、短信提醒)
Ø 监控syslog是否有日志输出;
q 要求:
Ø 每5分钟采集一次数据,对任何一个告警和日志都要进行分析;
Ø 具体要求参见《IDC监控规范》;
q 指标:
Ø 协议SLA或客户指标
l 故障确认时限 10分钟 ;
Ø 内控指标
l 告警确认时限5分钟;
q 边界:/
c) 告警和日志分析和处理
q 内容:
Ø 监控发现告警和有日志弹出时,进行分析;
Ø 及时处理或关闭。
q 要求:
Ø 对于出现的每一个告警和日志,一线都必须分析,确定原因;
Ø 做好预判断,有困难或有故障隐患的,3分钟内通知到二线;
Ø 建告警记录表,对于确认属于告警信息的,所有的分析进行记录,交接班的时候检查;
Ø 对多次告警和连续出现日志的事件,需要提交二线分析,并判断是否需要变更阈值清单;
Ø 具体要求参见《IDC监控规范》;
q 指标:
Ø 协议SLA或客户指标0000
l 故障确认时间<10分钟(一级指标)
Ø 内控指标
l 预判断时间<3分钟
l 一线告警分析完成率100%
l 二线告警分析检查率100%
l 二线周计划未包含针对一线能力提升计划的次数为0;
q 边界:
Ø /
1.2 巡检
q 内容:
Ø 机房各物理环境:门窗、机柜锁、灯、温湿度、通风、异常人员、清洁。
Ø 设备和硬件告警:包括网络、客户设备、电源、空调
q 要求:
Ø 每天按规定的时间巡检(南施街每天4次,金鸡湖每天五次),
Ø 按照《IDC巡检操作指南》规定的内容操作;
Ø 异常情况立即处理,具体异常可参照“巡检异常参考表”;
l 设备和硬件告警:
a) 属于我方维护范围内的设备:我方预处理,通知客户,对无法解决的找厂家;
b) 客户设备:巡检完成后立即通知客户,后续跟踪;
c) 电力、空调设备:异常应通知动能后续跟踪;
d) 消防设备检查:异常应通知安保并后续跟踪;
l 机房各物理环境
a) 人员检查:发现异常人员进出,需确认身份请其登记或离开;
(需确定金石利新的人员,请其带好工作证)
b) 机柜检查:检查机柜门锁和内部明显不符合项,及时处理;
c) 环境检查:机房门窗、灯等问题及时提报物业并后续跟踪管控,其它如无关物品或环境清洁问题等应及时处置。
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 上级抽查,对界面分工错答数为0;
l 二线每月陪同每个一线共同巡检1次;
l 上级检查到“巡检异常参考表”中的异常,但机房没有处理的事件数为0;
q 边界:
Ø 在要求的异常情况处理中已经描述。
1.3 交接班
q 内容:
Ø 值班人员交接过程中,进行共同巡检;
Ø 钥匙、工单、备件、工器具、遗留事项等工作内容的交接;
Ø 需要移交的其他信息项,如:一周内的值班记录、周报、运维记录;
q 要求:
Ø 每天2次交接班;
Ø 要求参见《IDC值班交接班规范》;
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 漏交接事项为0;
q 边界:
Ø 交接确认后,若发现交接确认事项中有异常,所有产生的后果由接班人承担。
1.4 综合检查
q 内容:
由二线带领的全面的检查活动
Ø 业务数据检查 —— 季
l 未使用的接口关闭;
l 删除多余的Vlan;
l 修改错误的描述;
Ø 信息安全的检查 —— 季
l 账户审计:无AAA认证的网络设备、服务器、PC;
l 口令修改:服务器、PC、网络设备;
l 口令清单审计:网络设备、服务器、PC;
l 漏洞扫描:全网扫描;
l 补丁更新:根据扫描的结果执行;
Ø 设备运行环境的检查 —— 月
l 机柜内集中保洁:保持机柜内整洁达到机柜线缆、设备的整齐有序无积尘;
l 设备盘点:库存设备、资产清点;
l 环境设施检查:电力、空调/通风、消防、照明等;
Ø 重点资料复核与更新 —— 月
l 资源表核对:客户清单、客户设备资料、网络设备端口状态表、IP地址段清单、Port-Channel清单,中国电信IDC资源管理模块数据采集表;
l 客户资料核对:每一家客户的资料都要核对;
l 知识库的复核与更新;
l 紧急联系表;
q 要求:
Ø 每次综合检查前,询问高云峰是不是有临时的输入项;
Ø 按照周期计划实施,届时请客户一起参与;
Ø 每次完成后,出报告发给部门经理审核;
Ø 具体操作参见《IDC综合检查指南》;
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 综合检查报告中遗漏检查点为0
q 边界:
Ø 对于检查出的问题,涉及用户需要整改的,要及时通知用户;
Ø 涉及到其他部门的问题,我们自己先协调,同时可以请高云峰出面;
1.5 周期性统计与分析
q 内容:
Ø 固定需要的内容
l 核心设备的运行状态统计(从CACTI中取出核心设备运行状态的平均值和峰值) ----周;
l 客户服务统计(客户设备告警、客户协助、接待等) ----周,月;
l 告警统计(环境温湿度、设备) ----周,月;
l 故障统计 ---- 周,月;
l 业务统计(工单,上下架)---- 周,月;
l 机柜使用统计 ---- 月;
l 机房流量Top5统计 ---- 月;
l 网络攻击统计 --- 月;
Ø 其它客户需要的内容
l 百度用电资源统计 ---- 周;
在“电流系统”中读取机架电表读数,按照客户格式制作报表,对于 >15A(或按照客户要求)需要highlight;
q 要求:
Ø 按照以上周期要求以周报和月报方式及时提交;
Ø 格式、内容和准确性达到客户的要求;
Ø 具体操作参见《IDC维护统计分析指南》;
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 未按时提交服务报告的次数为0;
l 因服务报告统计错误导致的客户不满意次数为0;
l 百度报告的准确率100%;
q 边界:
Ø /
1.6 备份与还原
q 内容:
Ø 网络设备的配置;
Ø 应用系统的数据;
q 要求:
Ø 备份应预留好专用的空间;
Ø 按照《备份管理实施规范》每季度复审“备份还原计划”;
Ø 按照计划实施,每月复核备份的有效性;
Ø 网络设备的操作参见《IDC备份还原操作指南》;
q 指标:
Ø 协议SLA或客户指标
l 网络联通性在99.9%以上
Ø 内控指标
l 备份执行率100%
l 网络设备数据还原时间<20分钟(每个设备制定不同的指标)
q 边界:/
1.7 清洁与保洁
q 内容:
Ø 机架内的清洁与保洁;
Ø 值班室、更衣室、仓库的清洁;
Ø 第三方清洁检查;
q 要求:
Ø 新机架清洁
l 施工完成后,做一次集中清洁;
l 客户上架前,对应机架进行一次清洁;
Ø 已有设备的机架:
l 客户上架后,当天的巡检特别关注对应机架的状态;
l 安排在综合检查时,集中保洁;
Ø 值班室、更衣室、仓库:日常5S每天做1次,清洁大扫除每周做1次;
Ø 针对第三方清洁,每次要做好检查,要求参见“机房清洁检查表”
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 质业部5S检查扣分为0;
l 机架内部无积灰;
q 边界:
Ø 机房内部,机架外部由清洁公司清洁,做好管控;
Ø 机房公共区域物由物业阿姨清洁,做好提醒。
2. 日常管理
2.1 物资管理
q 内容:
办公设备、仓库、备件、工器具、易耗品等的管理;
q 要求:
Ø 办公设备(主机、显示器、电视屏、打印机、座椅等)的日常使用的维护我们自己做好,明确处理故障的维保商和维保时限;
Ø 仓库的设备应专人负责统计核实,任何设备进出都应该有记录;
Ø 备件、工器具实施的要求:
l 备件工具每天交接班时检查,借出必须登记;
l 月度管理纳入综合检查活动;
Ø 易耗品每周检查一次是否需要申领申购;
Ø 具体要求参见《物资管理规范》;
q 指标:
Ø 协议SLA或客户指标:
l 电信资产核查的准确率100%;
Ø 内控指标:
l 盘点执行遗漏次数为100%;
l 备件、工器具有异常,但接班人未提出的次数为0;
q 边界:
Ø 用户的备件、工具等机房没有管理的职责;
2.2 资料的管理
q 内容:
“表单和记录”、“临时文件”、“系统和软件”、“项目资料”、“参考资料”;
q 要求:
Ø 资源表:
l 每次变更后要修改;
l 每月二线要核对;
Ø 客户联系表、客户在机房的内拓扑资料、资源使用情况等:
l 每次变更后要修改;
l 每月二线要检查;
l 对于大客户、重要客户属性需每月更新和发布;
Ø 文档的管理按照《资料管理规范》的要求实施更新、备份等。
q 指标:
Ø 协议SLA或客户指标:
l 无
Ø 内控指标:
l 资料抽查审计准确率100%
q 边界:
Ø /
3. 故障处理
3.1 故障处理
q 内容:
Ø 发现故障(客户报障、监控发现故障、维护操作时发生故障);
Ø 判断故障:
l 故障影响的范围多大(询问客户,同时主动测试);
l 是不是动环(电力、空调)设备故障;
l 是不是我们维护的设备故障;
l 是不是刚才现场做了什么操作导致了故障;
Ø 定位处理
l 如果仅仅是一家客户,一台设备故障,协助客户处理故障;
l 如果动环设备故障,报给相对应的部门处理,通知高云峰;
l 如果涉及到我们维护的设备,立刻报2线处理,同时汇报分部经理和高云峰;
l 如果刚才正在做某一操作时引起故障,想办法先回退,同时汇报分部经理和高云峰;
Ø 记录总结
l 故障处理完成后,记录故障;
l 有责任人的,总结故障报告,分析流程原因和技术原因;
q 要求:
Ø 一线按故障处理流程操作;
Ø 有问题及时上报二线处理;
Ø 二线的处理、上报要及时;
q 指标
Ø 协议SLA或客户指标
l 客户故障回复时间<30分钟;
l 故障确认时限10分钟;
l 故障上报到主管部门的时限30分钟;
l 书面报告<48小时
Ø 内控指标
l 故障发生后,未按规定通知相关方或升级的次数为0;
l 故障处理过程中,错误选择了故障处理流程数为0;
l 故障演练的过程中,流程规定时间正确判断处理故障率100%;
l 二线书面报告时间<36小时;
q 边界
Ø 属于我方维护范围内的设备:我方预处理,通知客户,对无法解决的找厂家,
Ø 客户设备:巡检完成后立即通知客户,后续跟踪;
Ø 电力、空调设备:通知动能,后续跟踪;
Ø 消防设备:通知安保,后续跟踪;
Ø 需要通知三线前来处理的,及时通知三线;
4 客户与业务
4.1 客户服务
a) 电话服务
q 内容:
Ø 值班电话来电后,值班人员接听来电;
Ø 电话呼出(按照相关计划或要求时)。
q 要求:
Ø 来电应答及时、准确、礼貌;
Ø 离开监控室时,值班电话应做来电转移到手机,保证不漏接来电;
Ø 要使用电话用语,对拿不准的问题可参考《IDC电话业务话术清单》;
Ø 对来电要做电话记录;
Ø 其它要参见《电话邮件服务制度》;
q 指标:
Ø 协议SLA或客户指标
l 扩容、割接提前3天通知客户;
Ø 内控指标
l 抽查漏接来电数为0;
l 电话抽查质量不符合要求数为0;
l 操作时间-通知客户时间>3天;
q 边界:
Ø /
b) 客户现场接待
q 内容:
Ø 办理维护卡;客户信息确认、登记,为客户办理业务,现场陪同,结单。
q 要求:
Ø 客户到机房:
l 请其出示维护卡,没有带维护卡,需要有客户公司公章的批准文件传真过来;
l 通网、通电我方操作、带客户到对应的机柜、开门、风淋;
l 现场清理,布线检查,归还工具……
Ø 新客户首次到机房:凭工单接待还需办理维护卡:提醒客户“办理维护卡的流程”,办理客户办理维护卡需要的资料包括客户身份证和公司信息的复印件或传真件(公司名称、客户姓名、客户身份证号码、机柜号、说明为办理维护卡,加盖公司公章);
Ø 用户的厂家:需要客户带领或者客户发书面的证明文件;
Ø 具体客户接待要求见“IDC客户接待要点表”。
q 指标:
Ø 协议SLA或客户指标
l 客户满意度≥99%;
l 每月有理由投诉率≤0.05%;
Ø 内控指标
l 回访单客户认可率100%
l 客户接待过程中,不使用服务礼貌用语的次数为0;
q 边界:
Ø 客户若不肯遵守机房的规定,请其离开机房;
4.2 工单处理
q 内容及要求如下,具体参见《IDC工单操作指南》:
Ø 查看是否有新工单和快超时的工单
l 工单界面开着,正常情况下,记得经常刷新;
l 工单作为巡检项目,巡检时检查;
l 交接班时,双方确认工单;
Ø 检查到有新工单到
l 报二线,
l 确认资源,判断工单是否可执行;
l 不可执行,报二线确认,与客户经理或资源中心联系后,返回设计流程;
l 可执行,是否是自己的授权操作范围;
l 是,做配置;
l 否,报二线重新分配。
l 完成后,联系客户确认操作时间,做阶段性回单。
Ø 检查到有快超时工单(当天超时)
l 确认是否已经阶段性回单;
l 没有,确认配置等是否已经准备好,联系客户,做阶段性回单。
l 有,提醒客户,工单快到期,做阶断性回单。
Ø 对于已经超时的工单
l 二线每周需要关注一次,并与客户联系确认,阶段回单。
l 月底与高云峰确认当月已超时的工单。
l 2周以上,长期超时的,与电信客户经理联系退单。
Ø 客户到现场后还没有工单
l 检查工单是否已经发出,没有发出,请客户联系客户经理下单;
l 如果已经有工单没有到岗,机柜资源已分配,可以先上架,但不给上电通网;
l 等全部审批通过后再操作。
Ø 客户到现场后工单还没有准备好
l 报二线,安排人员优先处理。
Ø 客户到现场后工单已经准备好
l 安排按照工单要求实施;
l 上下架按照“上下架流程操作”(尤其机架、机位,IP不能出错);
l 客户维护过程中注意事项提前跟客户讲清楚“客户操作注意事项”。
Ø 工单操作完成后
l 修改资源表,拍照留存,填写竣工单,回访单,系统回单。
q 指标:
Ø 协议SLA或客户指标
l 影响客户满意率的工单数为0;
l 超时未做阶段性回单的工单数为0;
Ø 内控指标
l 巡检时未记录新工单的次数为0;
l 接班人未提醒交班人做阶段性回单的次数为0;
l 工单超时当天,值班人未做阶段性回单的次数为0;
l 当月超时,未经过高云峰确认的工单数为0;
l 客户离开后,发现工单错误的个数为0;
l 工单配置导致故障数为0;
q 边界
Ø 客户:无单不动;
Ø 资源中心:1.按照资源中心的要求配置,要求与现场不符,与孔梅协商处理;2.工单完成后,资源变更回复给资源中心。
Ø 增值:对于客户到现场,却没有工单;或客户到现场后,发现工单错误;需联系增值吴中处理。对于长期超时的,与吴中联系退单。
Ø 网监:对于异常需要向高云峰汇报,请其协商处理。
5 其他服务项
5.1 参观接待
q 内容:
Ø 接待准备,陪同讲解
q 要求:
Ø 凭电信的批文;或者经高云峰确认;
Ø 所有一线都能够陪同讲解(按照增值提供的PPT讲解)
Ø 按照《IDC参观接待指南》
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 参观接待演练合格率100%
q 边界:/
5.2 第三方管控
q 内容:
Ø 对象:电信的第三方、无机房授权的电信人员。
Ø 常见事务:对于施工,维护故障处理,保洁等实施管控,包括进入、过程中和离开前检查核实。
q 要求:
Ø 按机房的制度实施管理,尤其是行为管理(如水不可以带入机房、抽样问题、物品堆放等等);
Ø 对于进入和确认:
l 电信的厂家,需要高云峰的确认;
l 施工需要电信审批的施工证明;
l 确认是否需要使用机房电源并为其明确;
l 对于百度机房,通知金石利新人员监管。
Ø 对于过程管理:
l 对于第三方人员在机房作业,应该用视频保持专门的监控;
l 凡是涉及维护的设备做操作或有可能影响设备运维的,我们需要全程陪同:需记录操作的全部过程,并索要相关的文档,做好配置的变更发布;
l 需管控活动范围,尤其是施工和维护有关的应严格限制其按照施工证明的范围进行监管;
Ø 离开前检查核实
l 对于施工、维护等,确认其所做的事项符合机房的相关规定或无影响项,以及做好相关清场复原工作,尤其对于布放线缆、机柜门锁等应重点检查;
l 对于机房及环境清洁还需检查达到机房清洁所要求的质量。
Ø 具体要求参见《IDC监控规范》;
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 人员进出机房未登记数为0;
l 第三方离开后,发现作业质量不合格的数量为0;
l 客户或上级发现第三方人员违反机房管理制度,而我方未劝阻的事件数为0;
q 边界:
Ø 百度的厂方,其在百度机房的操作我们不负责管控。
5.3 客户发起的业务
q 内容:
Ø 客户提出业务需求;
Ø 二线明确工作任务;
Ø 二线安排处理;
Ø 完成后二线反馈;
q 要求:
Ø 通过OA,邮件明确工作任务,处理时限等;
Ø 对客户要求的长期性工作,记录在《客户要求记录表》中;
Ø 核对现有资源确认是否可操作;
Ø 根据正常的业务工作量,判断是否能及时提交;
Ø 有疑议的及时反馈给客户,需要协调的及时上报给分部经理。
Ø 若涉及到设备配置,跟工单流程类似操作:做好备份,操作后更新资源;
Ø 若是统计类的工作,要安排好人员,尤其是夜班人员的工作量,确保及时提交;
Ø 其他具体工作细节,二线做好管控,要尤其关注此类工作提交的质量(数据的准确性二线需要核对)。
Ø 工作附件通过邮件或OA反馈给客户;
Ø 客户提出需求时,若有电话联系的,应电话联系客户反馈完成情况。
q 指标:
Ø 协议SLA或客户指标
l 无
Ø 内控指标
l 客户OA要求明确,但现场仍未按客户要求执行的工作数为0;
l 提交客户后返工1次以上的工作数为0
q 边界:
Ø 客户布置任务时,需有书面的质量时限要求;
Ø 若是紧急的需求,需要电话提醒。
6 记录/附录
No.
记录名称
记录编号
保存期限
保存部门
1
客户要求记录表
DR-6019.1.1
2 年
IDC
(注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)
展开阅读全文