资源描述
中国铁塔股份有限公司南昌市分公司
故障归档及质检规范
工单流程在全流程中的位置:
1 工单回复规范
为确保故障及时处理,处理过程清晰,原因明确,在工单回复时需遵照处理措施、故 障原因分类、受理处理时限三项要求。
1.1 处理措施
处理措施是故障处理过程及消除后, 受理方针对该故障处理过程的描述和总结, 内容必须 填写完整。包括: [处理结果] 、 [故障原因]、 [故障处理措施及时间要点]、 [故障消除时 间]等,其中:
1) 故障处理结果分为“已解决”、“延期解决”、“无需解决”三种。该字段在 故障工单回复时为必填字段, 需如实填写。对延期申请的工单则填写延期解决。
2) 故障原因应根据问题解决分析过程,填写故障根本原因。故障原因需与故障原 因分类保持一致。 (故障原因在工单回复时为必填字段)。
3) 故障处理措施及时间要点要记录故障处理过程中的关键点,内容至少包括时间 点、具体处理措施等。
4) 故障消除时间要符合故障实际处理情况,即:故障消除时间≥告警清除时间。
5) 不能出现“已好、修复、好”等模糊字段,或者有错别字。
1.2 故障原因分类
回复工单需明确故障原因,并按照规范选择分类,为工单统计分析提供量化的标 准。附件为故障原因分类表:
针对掌上运维工单,故障原因精简至以下分类。
【故障原因类别】 动力环境-高低压设备
【原因分类说明】 由于高压供电设备、低压配电设备、变压器等引起的故障告警
【故障原因类别】 动力环境-开关电源
【原因分类说明】 由于开关电源的交、 直流部分、 整流模块、监控模块等所引起的故障告警 【故障原因类别】 动力环境-UPS 设备
【原因分类说明】 由于 UPS 设备的输入、输出部分,整流、逆变模块等所引起的故障告警 【故障原因类别】 动力环境-油机
【原因分类说明】 输出电压、电流异常,启动电池故障等
【故障原因类别】 动力环境-蓄电池
【原因分类说明】 由于电池内部故障造成的过压、欠压、温升、短路、断路等
【故障原因类别】 动力环境-空调
【原因分类说明】 由于空调设备各组成部件引起的告警,如压缩机、风机故障等 【故障原因类别】 动力环境-监控通讯
【原因分类说明】 由于监控设备自身软硬件问题所引起的数据采集器、系统通讯故障。 【故障原因类别】 动力环境-环境
【原因分类说明】 机房环境温度、湿度、门禁等原因引起的告警.
【故障原因类别】安全事件-恶意软件
【原因分类说明】 由于设备安装了非法恶意软件,导致设备系统受到正常工作运行的影响, 而出现的安全事件。恶意软件类型主要包括“占用正常网络资源 (BT、迅雷、网际快车 等 P2P 下载工具)、 强制安装、 难以卸载、 浏览器劫持、 广告弹出、 恶意收集用户信息、 恶意卸载、 恶意捆绑、其他侵害用户软件安装、使用和卸载知情权、选择权的恶意行为
【故障原因类别】安全事件-网络攻击
【原因分类说明】 由于设备受到来自外部或内部的非正常服务侵入,使系统受到致命影响。 【故障原因类别】安全事件-安全设备故障
【原因分类说明】 主要就是安全设备的性能物理实体故障, 主要包括“安全设备自身出 现的软件、硬件、电源、 CPU 性能低、线缆等物理实体故障。
【故障原因类别】安全事件-配置违规
【原因分类说明】 由于工程人员或厂家工程师对设备、 系统进行不合法修改或配置, 导致出 现安全漏洞、风险、隐患。
【故障原因类别】安全事件-网络安全漏洞
【原因分类说明】 系统遭到入侵者通过 “受限制的计算机、 组件、 应用程序或其他联机资源 的无意中留下的不受保护的入口点, 非法使用或破坏某一信息系统中的资源, 以及非授 权使系统丧失部分或全部服务功能的行为。
【故障原因类别】安全事件-操作信息提示
【原因分类说明】 由于人为或系统自身对设备进行正常或非法操作记录下的安全日志 LOG 信息。
2 工单质检规范
1) 告警发生时间、告警派单时间、告警清除时间、工单回复时间、采取措施时间 点不能存在逻辑错误。
2) 监控人员需结合工单中的告警清除时间和告警系统中的时间判断告警的恢复情 况,未有告警清除时间的工单区域需上传相关告警日志或截图。
3) 维护人反馈故障原因及处理过程存在乱报、错报的一律驳回,重新处理;特别 对于重要及重大告警应对故障原因和故障处理过程严格把关,督促各维护单位 查清原因、有效处理,同时监控人员应对重要及重大告警发生动环进行重点监 控及时发现隐患故障。
4) 对于任何工单不能没有故障原因和处理过程的直接归档。对于确实无法查询原 因和没有进行任何操作的故障,自行恢复的,需要对在本月出现的告警频次进 行分析,如果总共本月频次少于 3 次可以归档,原则上监控人员必须在归档中 明确写明“系统瞬时告警、查询系统运行正常,未出现异常告警,观察较长时 间告警未出现”等;本月出现频次等于或超过 3 次,驳回工单注明出现频次并 要求再次调查故障原因。
5) 工单故障原因归类符合要求。
6) 工单内容不能出现“已好、修复、好”等模糊字段,无错别字。
一、系统故障表述与维护员所选故障原因不对应:如系统告警表述写的是“水浸探测到积水”,
维护员 APP 上选择的故障原因是“开关电源故障- 电源模块故障”
,这种故障应该是选择“动环故障-水浸传感器故障”;
二、站址免责情况: 很多站点维护员都在回单时候勾选了免责, 但实际上并没有与有关方(运 营商,铁塔区域经理)达成免责协议,以后勾选站点免责需满足这几种情况:
1、停电因为某些原因无法发电的站点:已向运营商申请闭站并且运营商已同意闭站的一定 要在 APP 回单中备注, “某某原因运营商已同意闭站”,这类对应免责条款 3-客户原因; 2 站 上面设备损坏, 站点被破坏, 自然灾害等短时间内无法修复的站址: 已通知该片区区域经理 并且同意站点免责, 这类故障类型统一选择“其它原因-人为破坏, 自然灾害”,并在回单中 写明,这类对应免责条款 1-不可抗力;
3 现场正在施工改造的站点(加设备,动环改造等)由动环改造负责人, 设备改造单位或区 域经理通知,这类故障统一选“其它原因-人为施工”,并在回单中写明, 这类对应免责条款 4-免责站址;
4 夜间免责 : 目前 0 点-6 点为免责时段, 这段时间内出现的工单, 这类对应免责条款 2-夜间 免责;
三、回复内容过于简单,例如“自动恢复,已恢复,好”,对于人工处理后恢复的,需简单 说明做过的操作,未上站故障自动恢复的故障,可备注为“查中自复”或“与监控中心确认 告警已恢复”,类似备注了“误告警”但又未上站的,明显属于自相矛盾;
四、 到站上处理故障时候一定要记得在是否上站勾选是并且在APP 工单上签到 (勾选这个会 自动上传当前位置经纬度),有的工单是否上站选的否,故障回复又是写的上站发电,送空 开之类的自相矛盾;
五、假回单现象,未处理,直接联系机房反馈误告警消除故障。
展开阅读全文