资源描述
第一章 小型机存储系统巡检报告
1 小型机存储设备检查内容(局域网部分)
1.1 IBM小型机
机器型号: 序列号:
主机名: IP地址:
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□ 否□
2
工作环境相对湿度要求40%~70%
是□ 否□
3
机房封尘,尘土少
是□ 否□
4
UPS运行情况
是□ 否□
系统硬件外观检查
1
设备故障灯是否有亮
是□ 否□
2
硬件外观是否有异常
是□ 否□
硬件错误报告(Error Log)
1
AIX是否有硬件故障记录errpt –H
是□ 否□
2
mail是否有硬件错误
是□ 否□
3
bootlog/consolelog是否正常
是□ 否□
4
ASMI log是否正常
是□ 否□ N/A□
5
HMC Event Log是否正常
是□ 否□ N/A□
6
磁带机是否需要清洗
是□ 否□ N/A□
硬件配置检查
1
CPU是否有deconfigration
是□ 否□
2
内存是否有deconfigration
是□ 否□
3
CPU GUARD设置是否正确
是□ 否□
硬件诊断(不建议在线运行DIAG程序)
1
系统板、CPU、内存是否正常
是□ 否□
2
IO板、扩展卡是否正常
是□ 否□
3
磁盘、磁盘阵列是否正常
是□ 否□
4
磁带机、磁带库是否正常
是□ 否□
AIX操作系统及HACMP检查
1
系统错误报告是否有软件错误errpt
是□ 否□
2
mail中是否有软件错误
是□ 否□
3
是否有使用率大于85%的文件系统
是□ 否□
4
JFS log设置是否正确
是□ 否□
5
是否有Stale LV
是□ 否□
6
内存交换区使用率是否超过70%
是□ 否□
7
系统备份是否符合要求
最近一次备份时间:
是□ 否□
8
rootvg是否有数据保护
是□ 否□
9
HACMP Cluster Verufication是否正常
是□ 否□
10
HACMP相关参数是否正确
是□ 否□
11
HACMP接管测试是否正常
是□ 否□ 不做□
12
操作系统版本及补丁情况
13
硬件微码版本
运行snap –r;snap –gfkbLc 并且收回系统信息文件存档
1.2 IBM磁盘阵列
机器型号: 序列号:
控制器IP地址:
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□ 否□
2
工作环境相对湿度要求40%~70%
是□ 否□
3
机房封尘,尘土少
是□ 否□
4
UPS运行情况
是□ 否□
系统硬件外观检查
1
设备故障灯是否有亮
是□ 否□
2
硬件外观是否有异常
是□ 否□
SM软件检测
1
是否有错误日志记录
是□ 否□
2
服务器端是否有磁盘错误
是□ 否□
3
记录微码版本
运行SM Collect收集阵列配置信息并存档
1.3 IBM TSM巡检记录
TSM相关硬件信息
AIX lsdev –Cctape Windows 查看设备管理器
设备状态输出
检查TSM内部设备检查
1
检查通路Query Path是否全部Online
是□ 否□
2
检查驱动器Query Drive
是否全部available
是□ 否□
检查结果输出:
TSM日志检查
1
查询ACT Log是否有异常
Q act begind=-60 search=fail
是□ 否□
2
查看磁带状态
q vol access=unavail
q vol access=readonly
是否存在异常
是□ 否□
检查结果输出:
检查DB、LOG状态
Q db f=d
Q dbvol f=d
Available Space (MB)
Assigned Capacity (MB)
DB volume name
使用率
是否需要扩充
Q log f=d
Q logvol f=d
Available Space (MB)
Assigned Capacity (MB)
Log volume name
使用率
是否需要扩充
检查结果输出:
检查应用程序备份日志
如果是TDP for Exchange应用则应该收集:
tdpexc.log
如果是TSM API客户端应用则应该收集:
dsierror.log
如果是TDP for Oralce,则应该收集:
tdpoerror.log
如果是针对DB2备份,则应该收集:
db2diag.log,db2alert.log,userexit.log
如果是TDP for SQL,则应该收集:
tdpsql.log
运行dsmadmc批处理收集TSM服务器配置 收集macro.out文件
dsmadmc -id=admin -password=admin -outfile=macro.out -NOConfirm macro query.mac
query.mac:
q system
Q NODE F=D
Q SCHEDULE F=D
q sche type=admin f=d
Q LIBV F=D
q drive f=d
q path f=d
Q act begind=-60 search=fail
q vol access=unavail
q vol access=readonly
收集dsmserv.opt devconfig volhistory 文件
收集各个应用程序备份log
发现的问题及解决方案
序号
测试内容及操作
情况
结果
备注
机房环境
1
工作环境温度要求10℃~25℃
是□ 否□
2
工作环境相对湿度要求40%~70%
是□ 否□
3
机房封尘,尘土少
是□ 否□
4
UPS运行情况
是□ 否□
系统硬件外观检查
1
设备故障灯是否有亮
是□ 否□
2
硬件外观是否有异常
是□ 否□
SM软件检测
1
是否有错误日志记录
是□ 否□
2
服务器端是否有磁盘错误
是□ 否□
3
记录微码版本
展开阅读全文