资源描述
主机资源岗工作内容
一. 服务对象
服务对象包含:
1)PC服务器、小型机、主机等硬件和相关操作系统;
2)磁盘阵列、磁带库等。
二. 调研评定
a) 服务器调研评定
依据需方、服务相关方或应用系统运行需求,提供服务器调研评定服务,并提出处理或改善提议和方案。
b) 存放调研评定
经过对存放设备运行统计、运行趋势进行分析,依据应用系统特点和运行需求,提出处理或改善提议和方案。
三. 例行操作
1) 监控
关键是对服务器、存放运行状态、运行性能、资源使用分配情况进行监控,方便了解其是否满足运行要求。监控应该定时或全时段进行监控。监控内容参见表4,包含但不限于:
表4物理资源监控内容表
服务对象
监控内容
服务器
Ø 监控主机服务器LED面板运行错误码和指示灯
Ø 监控服务器电源工作状态指示灯
Ø 监控服务器硬盘工作状态指示灯
Ø 监控服务器CPU使用百分比情况
Ø 监控操作系统关键文件系统空间使用情况
Ø 监控服务器内存使用情况等
Ø 监控服务器系统日志
Ø 监控服务器磁盘IO
Ø 监控网络端口状态和流量
存放
Ø 监控存放设备控制器工作状态指示灯
Ø 监控存放设备电源工作状态指示灯
Ø 监控存放设备数据存放介质空间使用情况
Ø 监控存放设备读写速率情况
Ø 监控存放设备吞吐量
2) 预防性检验
在监控服务基础上,对服务器、存放进行预防性检验。包含:性能检验、脆弱性检验。服务器、存放预防性检验内容参见表1,包含但不限于:
表1物理资源预防性检验内容表
服务对象
性能检验内容
脆弱性检验内容
服务器
Ø 检验服务器CPU使用峰值情况
Ø 检验服务器内存使用峰值情况
Ø 检验操作系统关键文件系统空间使用情况
Ø 检验服务器IO读写情况
Ø 查数据流网络流量情况等
Ø 检验服务器关键硬件部件是否满足运行冗余度要求
Ø 目前操作系统版本是否安装相关风险补丁
Ø 是否需要升级系统微码
Ø 是否关闭无须要服务进程
Ø 关键业务数据文件或操作系统文件空间使用是否达成预定阀值
Ø 关键机密系统数据安全防护设置是否满足要求
Ø 系统使用资源是否超出预定阀值
存放
Ø 检验IO读写速率情况
Ø 检验读、写缓存分配百分比情况
Ø 检验数据读、写命中率情况
Ø 检验存放硬盘空间使用情况
Ø 检验存放RAID等级情况
Ø 检验存放系统日志情况
Ø 检验存放全部连接主机信息
Ø 检验存放关键硬件部件是否满足运行冗余度要求
Ø 目前微码版本是否需要升级
Ø 存放配置备份机制是否完善
Ø 存放管理软件是否需要升级或打补丁
Ø 存放空间使用百分比是否达成预定告警阀值
Ø 存放介质坏块统计检验
a)
b)
3) 常规作业
物理资源(网络、服务器、存放)常规作业内容参见表2,包含但不限于:
表2物理资源常规作业内容表
服务对象
常规作业内容
服务器
Ø 系统微码升级
Ø 设备清洁
Ø 输入、输出电压检测
Ø 磁盘读、写正常性测试
Ø 输入、输出设备读写测试(光驱、内置磁带机)
Ø 配置文件备份
Ø 操作系统备份
Ø 过期运行日志清理
Ø 网络通讯正常性测试
Ø 临时文件清理
Ø 端口访问测试
Ø 周期性关键设备主备切换/应急演练
存放
Ø 系统微码升级
Ø 更换控制器电池
Ø 输入、输出电压检测
Ø 磁盘读、写正常性测试
Ø 配置文件备份
Ø 过期运行日志清理
Ø 和连接主机通讯正常性测试
Ø 端口访问测试
四. 响应支持
1) 事件驱动响应
a) 服务器事件驱动响应
针对服务器设备软、硬件故障引发业务中止或运行效率无法满足正常运行要求,而进行响应服务,比如:
1) 服务器重启;
2) 关键服务、进程启用、停止等;
3) 操作系统恢复;
4) 更换故障部件,包含主板、电源、CPU、内存、硬盘等;
5) 损坏系统文件修复;
6) 网络通讯设置修正等。
b) 存放事件驱动响应
针对存放设备软、硬件故障引发业务中止或运行效率无法满足正常运行要求,而进行响应服务,包含但不限于:
1) 存放重启;
2) 配置文件恢复;
3) 更换故障部件,包含电源、硬盘等;
4) 微码升级;
5) 存放管理软件补丁安装;
6) 数据修复。
2) 服务请求响应
a) 服务器服务请求响应
依据应用系统运行需要或需方、服务相关方请求,而进行服务器响应服务,比如:
1) 设备搬迁;
2) 设备停机演练;
3) 设备清洁维护等。
b) 存放服务请求响应
依据应用系统运行需要或需方、服务相关方请求,而进行存放响应服务,包含但不限于:
1) 存放设备搬迁;
2) 存放设备停机演练;
3) 存放设备清洁维护;
4) 存放硬盘空间扩容;
5) 存放结构调整;
6) 新增主机分配存放空间;
7) 主机端多路径软件安装配置。
五. 优化改善
1) 适应性改善
a) 服务器适应性改善
依据应用系统特点和运行需求,对服务器进行调整,包含但不限于:
1) 服务器交换区容量调整;
2) 操作系统内核参数调整;
3) 磁盘保护等级调整;
4) 文件系统使用空间调整划分。
b) 存放适应性改善
依据应用系统特点和运行需求,对存放设备进行调整,包含但不限于:
1) 存放设备读写CACHE百分比调整;
2) 存放设备RAID保护等级调整;
3) 存放设备新增硬盘,包含新增磁盘扩展柜;
4) 存放设备逻辑盘容量调整;
5) 存放设备分配主机调整;
6) 光纤交换机ZONE计划调整。
2) 增强性改善
a) 服务器增强性改善
依据应用系统特点和运行需求,经过对服务器运行统计、趋势分析,对服务器进行调整、扩容或升级,包含但不限于:
1) 为本服务器从存放系统上分配更大空间;
2) 服务器CPU个数增加;
3) 服务器内存容量增加;
4) 服务器磁盘空间扩容;
5) 服务器网卡和HBA接口卡增加等。
b) 存放增强性改善
依据应用系统特点和运行需求,经过对存放设备运行统计、趋势分析,对存放设备进行调整、扩容或升级,包含但不限于:
1) 存放设备控制器、硬盘等部件微码升级;
2) 存放设备新增硬盘扩容,包含新增磁盘扩展柜;
3) 存放设备CACHE容量增加;
4) 存放设备光纤模块升级;
5) 光纤交换机光纤模块升级;
6) 存放设备管理软件版本升级。
3) 预防性改善
a) 服务器预防性改善
依据对服务器运行统计、趋势分析,结合应用系统需求,发觉服务器脆弱点,有针对性地进行改善性作业,包含但不限于:
1) 删除垃圾数据,释放数据空间;
2) 增加数据文件空间使用范围;
3) 增加电源供电模块冗余;
b) 存放预防性改善
依据对存放设备运行统计、趋势分析,结合应用系统需求,发觉存放设备脆弱点,有针对性地进行改善性作业,包含但不限于:
1) 搜集磁盘空间使用情况,立即清理垃圾数据或增加存放设备容量;
2) 查看存放控制器电池使用情况,立即更换新电池;
3) 检验存放设备电源是否老化,立即更换新电源;
4) 查看存放设备读写性能,适时调整存放控制器CACHE容量。
展开阅读全文