1、第一章 小型机存储系统巡检报告 1 小型机存储设备检查内容(局域网部分) 1.1 IBM小型机 机器型号: 序列号: 主机名: IP地址: 序号 测试内容及操作 情况 结果 备注 机房环境 1 工作环境温度要求10℃~25℃ 是□ 否□ 2 工作环境相对湿度要求40%~70% 是□ 否□ 3 机房封尘,尘土少 是□ 否□ 4 UPS运行情况 是□ 否□ 系统硬件外观检查
2、1 设备故障灯是否有亮 是□ 否□ 2 硬件外观是否有异常 是□ 否□ 硬件错误报告(Error Log) 1 AIX是否有硬件故障记录errpt –H 是□ 否□ 2 mail是否有硬件错误 是□ 否□ 3 bootlog/consolelog是否正常 是□ 否□ 4 ASMI log是否正常 是□ 否□ N/A□ 5 HMC Event Log是否正常 是□ 否□ N/A□ 6 磁带机是否需要清洗 是□ 否□ N/A□ 硬件配置检查 1 CPU是否有deco
3、nfigration 是□ 否□ 2 内存是否有deconfigration 是□ 否□ 3 CPU GUARD设置是否正确 是□ 否□ 硬件诊断(不建议在线运行DIAG程序) 1 系统板、CPU、内存是否正常 是□ 否□ 2 IO板、扩展卡是否正常 是□ 否□ 3 磁盘、磁盘阵列是否正常 是□ 否□ 4 磁带机、磁带库是否正常 是□ 否□ AIX操作系统及HACMP检查 1 系统错误报告是否有软件错误errpt 是□ 否□ 2 mail中是否有软件错误 是
4、□ 否□ 3 是否有使用率大于85%的文件系统 是□ 否□ 4 JFS log设置是否正确 是□ 否□ 5 是否有Stale LV 是□ 否□ 6 内存交换区使用率是否超过70% 是□ 否□ 7 系统备份是否符合要求 最近一次备份时间: 是□ 否□ 8 rootvg是否有数据保护 是□ 否□ 9 HACMP Cluster Verufication是否正常 是□ 否□ 10 HACMP相关参数是否正确 是□ 否□ 11 HACMP接管测试是否正常
5、是□ 否□ 不做□ 12 操作系统版本及补丁情况 13 硬件微码版本 运行snap –r;snap –gfkbLc 并且收回系统信息文件存档 1.2 IBM磁盘阵列 机器型号: 序列号: 控制器IP地址: 序号 测试内容及操作 情况 结果 备注 机房环境 1 工作环境温度要求10℃~25℃ 是□ 否□ 2 工作环境相对湿度要求40%~70% 是□ 否□ 3 机房封尘,尘土少 是□ 否□
6、 4 UPS运行情况 是□ 否□ 系统硬件外观检查 1 设备故障灯是否有亮 是□ 否□ 2 硬件外观是否有异常 是□ 否□ SM软件检测 1 是否有错误日志记录 是□ 否□ 2 服务器端是否有磁盘错误 是□ 否□ 3 记录微码版本 运行SM Collect收集阵列配置信息并存档 1.3 IBM TSM巡检记录 TSM相关硬件信息 AIX lsdev –Cctape Windows 查看设备管理器 设备状态输出
7、 检查TSM内部设备检查 1 检查通路Query Path是否全部Online 是□ 否□ 2 检查驱动器Query Drive 是否全部available 是□ 否□ 检查结果输出: TSM日志检查 1 查询ACT Log是否有异常 Q act begind=-60 search=fail 是□ 否□ 2 查看磁带状态 q vol access=unavail q vol access=readonl
8、y 是否存在异常 是□ 否□ 检查结果输出: 检查DB、LOG状态 Q db f=d Q dbvol f=d Available Space (MB) Assigned Capacity (MB) DB volume name 使用率 是否需要扩充 Q log f=d Q logvol f=d Available Space (MB) Assigned Capacity (MB) Log volume name 使用率 是否需要扩充 检查结果输出:
9、 检查应用程序备份日志 如果是TDP for Exchange应用则应该收集: tdpexc.log 如果是TSM API客户端应用则应该收集: dsierror.log 如果是TDP for Oralce,则应该收集: tdpoerror.log 如果是针对DB2备份,则应该收集: db2diag.log,db2alert.log,userexit.log 如果是TDP for SQL,则应该收集: tdpsql.log 运行dsmadmc批处理收集TSM服务器配置 收集macro.out文件 dsmadmc -id=admin -passwo
10、rd=admin -outfile=macro.out -NOConfirm macro query.mac query.mac: q system Q NODE F=D Q SCHEDULE F=D q sche type=admin f=d Q LIBV F=D q drive f=d q path f=d Q act begind=-60 search=fail q vol access=unavail q vol access=readonly 收集dsmserv.opt devconfig volhistory 文件 收集各个应用程序备份log
11、 发现的问题及解决方案 序号 测试内容及操作 情况 结果 备注 机房环境 1 工作环境温度要求10℃~25℃ 是□ 否□ 2 工作环境相对湿度要求40%~70% 是□ 否□ 3 机房封尘,尘土少 是□ 否□ 4 UPS运行情况 是□ 否□ 系统硬件外观检查 1 设备故障灯是否有亮 是□ 否□ 2 硬件外观是否有异常 是□ 否□ SM软件检测 1 是否有错误日志记录 是□ 否□ 2 服务器端是否有磁盘错误 是□ 否□ 3 记录微码版本






