资源描述
AIX主机日常检查指导
一、机房环境检查
检测项目
方法或结果
机房温度
10 ℃-40℃ 最佳 18℃ - 22℃
机房湿度
8% - 80%
UPS电源工作情况以及负载
查看UPS负载值
机房有无设备声音报警
无声音报警
二、AIX主机硬件状态检查
项目
方法或结果
可用CPU
lsdev -Cc processor
bindprocessor -q
可用内存
lsattr -El mem0
或lsconf中的Memory Size: XX MB Good Memory Size: XX MB
或ASMI中查看memory
主机硬盘
lsdev -Cc disk
故障告警灯
不亮
关闭小型机橙色告警灯:
使用root用户登陆系统,执行“diag”命令,回车继续;
1、选择“Task Selection”,回车继续;
2、选择“Identify and Attention Indicators”,回车继续;
3、选择“Set System Attention Indicator to Normal”,回车,“Set System
Attention Indicator to Normal”前面出现“+”号,表示选定此项;
4、按“F7”提交。以上步骤可以熄灭小型机橙色告警灯
电源灯
常亮
HBA卡
工作灯闪烁工作。
网卡
工作灯闪烁工作。
系统其它扩展卡
三、磁盘阵列硬件状态检查
项目
方法或结果
故障告警灯
故障灯不亮
电源灯
常亮
控制器
故障灯不亮
硬盘灯
所有硬盘指示灯一样,无红色或异常颜色告警
raid状态
使用SM工具连接到两个控制器查看盘阵工作状态。
IBM DS4K/5K:
A控 192.168.128.101 192.168.129.101
B控 192.168.128.102 192.168.129.102
fget_config –Av
mpio_get_config -Av
四、AIX操作系统状态检查
1,系统信息
操作系统版本
oslevel -r
操作系统补丁
instfix -i |grep ML
内核
bootinfo -K
微码
lsmcode -c
HA版本
lslpp -l cluster
2,系统状态
检测项目
方法和结果
系统错误日志
系统错误报告(Error Log)的检查:
硬件故障检测命令:# errpt -d H -T PERM
软件故障检测命令:# errpt -d S -T PERM
操作系统mail
#mail
1) 观察所有未读消息,注意有关diagela的消息。
2) 常用命令:
h [<num>] Display headings of group containing message <num>
t [<msg_list>] Display messages in <msg_list> or current message.
n Display next message.
q Quit
文件系统使用率
#df -g
%Used为文件系统的使用率。所有文件系统的使用率不能大于80%
逻辑卷状态
#lsvg -l rootvg
不能有“stale”状态的逻辑卷
内存交换区使用率
#lsps –a
使用率不能超过70%
网络
通信
网卡状态
#ifconfig -a
输出判断:
主备网卡的flag为UP属正常。同时检查ip地址和netmask是否正确。
路由状态
#lsattr -El inet0
网卡通信
#ping [ip address]
输出判断:
用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。
数据
安全
rootvg镜像
#lsvg –l rootvg
检查LPs :PPs是1:2关系
是否有最近os备份
将一盘新磁带或无用磁带插入磁带机
#tctl -f /dev/rmt0 rewind (重绕磁带设备)
备份
#smitty mksysb
磁带机是否需要清洗
#lsdev -Cc tape
查看磁带机黄灯是否亮,亮黄灯表示要清洗。
#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。
系统dump设置
#sysdumpdev -l
primary /dev/lg_dumplv 或 /dev/hd6
secondary /dev/sysdumpnull
copy directory /var/adm/ras
forced copy flag TRUE
always allow dump FALSE
dump compression ON
#sysdumpdev -e
#lslv lg_dumplv
#lslv -l lg_dumplv
若不正确请用下列命令修改:
#sysdumdev –P –p /dev/XXX –s /dev/sysdumpnull
HA
资源组状态
查看资源组配置
#lsvg –o
查看资源组卷组是否激活
IP地址
cat hosts
netstat –in
HACMP 配置检测 Cluster Verification
#lssrc -g cluster
查看服务
# /usr/sbin/cluster/diag/clconfig -v '-tr'
输出判断:
结果无Fail项输出。
diag诊断
命令顺序为:
1.#diag
2.Enter
3.Diagnostic Routines
4.System Verification
5.All Resources
6.F7
输出判断:
结果应为No trouble was found.
Topas & Vmstat
os
参数
Vmo参数
检查:
vmo -a | egrep -i "maxclient|minperm|maxperm|strict_maxperm"
更改:
/usr/sbin/vmo -o maxclient%=20 -o minperm%=10 -o maxperm%=20 -o strict_maxperm=1
mkitab "vmocfg:2:once:/usr/sbin/vmo -o maxclient%=20 -o minperm%=10 -o maxperm%=20 -o strict_maxperm=1"
limits参数
#ulimit –a
输出判断:
结果应为
time(seconds) unlimited
file(blocks) unlimited
data(kbytes) unlimited
stack(kbytes) 32768
memory(kbytes) 32768
coredump(blocks) 2097151
nofiles(descriptors) 2000
更改命令为:
#vi /etc/security/limits
aio参数
# lsdev -Cc aio
输出判断:
结果应为
aio0 Available Asynchronous I/O
# lsattr -El aio0
输出判断:
结果应为
autoconfig available STATE to be configured at system restart True
fastpath enable State of fast path True
kprocprio 39 Server PRIORITY True
maxreqs 4096 Maximum number of REQUESTS True
maxservers 10 MAXIMUM number of servers per cpu True
minservers 1 MINIMUM number of servers True 更改命令为:
#smitty aio
AIO通常只对文件系统起作用,对裸设备没有作用。最大为10X并行磁盘数<80,最小为最大的一半。
①、定义系统中的AIO设备
smitty aio -> Configure Defined Asynchronous I/O 然后回车执行;
②、激活系统中的AIO设备
smitty aio -> Change / Show Characteristics of Asynchronous I/O回车出现AIO配置对话框,将对话框中〔STATE to be configured at system restart〕域选择为“available”,然后回车执行;
注:系统会提示只有在重起后才能生效。
HIGH water mark for pending write I/Os
# lsattr -El sys0 |grep maxpout
输出判断:
结果应为
maxpout 33 HIGH water mark for pending write I/Os per file True
LOW water mark for pending write I/Os
# lsattr -El sys0|grep minpout
输出判断:
结果应为
minpout 24 LOW water mark for pending write I/Os per file True
更改命令为:
#chdev -l sys0 -a maxpout='33' -a minpout='24'
Syncd参数
# grep syncd /sbin/rc.boot
输出判断:
结果应为
nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &
更改命令为:#vi /sbin/rc.boot
ASMI管理口默认IP:
Power5是192.168.2/3.147
Power6/7是169.254.2/3.147
展开阅读全文