1、日常简易维护和报修指南目 录一、系统命令3二、备份和恢复6三、AIX安全10四、错误日志查看12五、Performance Tools14一、系统命令检验系统状态: 系统整体:prtconf 文件系统:df k,df -g设备: lsdev C 获取设备名称、状态、位置和描述。例: 查看硬盘: lsdev Cc disk查看磁带机: lsdev Cc tape查看适配卡: lsdev Cc adapter处理器个数 lsdev C|grep proc系统配置lscfg vp 获取全部已配置硬件设备具体信息。例:查看硬盘信息: lscfg vl hdiskx x表示数字查看网卡信息: lscfg
2、 vl entx x表示数字查看磁带机: lscfg vl rmtx x表示数字查看硬件属性: lsattr El 获取已配置设备属性信息。例:查看硬盘属性: lsattr El hdiskx x表示数字查看网卡属性: lsattr El entx x表示数字查看磁带机属性: lsattr El rmtx x表示数字内存大小: lsattr El mem0 磁盘lspv 交换分区lsps a 软件lslpp l 文件包名字 用户who关机命令:shutdown一分钟后关机shutdown +2二分钟后关机shutdown Fr关机重启(-r)关机命令调用/etc/rc.shutdown关闭程序
3、 能够在这个文件里加上你自己脚本其它基础命令# passwdpasswd:输入旧口令new passwd:输入新口令re-enter new passwd:重新输入新mkdir/rm/mv/cd -用于创建目录/删除文件或目录/更改文件或目录名/进入某一目录ls 显示目录中内容(文件名)#ls a 列出目前目录中全部文件#ls l 显示文件具体信息ps / kill 显示后台进程相关信息或杀死后台进程#kill -9 253432find 在一个/多个目录中查找符合条件文件 #find name t* -printhead/tail 显示文件头/尾声内容 #tail +200 filename
4、who/finger 列出系统注册/已登录用户 #who am I #finger user2光驱cdrom加载cdrom 使用: mount -rv cdrfs /dev/cd0 /cdrom或创建一个CD-ROM文件系统并进行加载smit cdrfsmount /cdrom卸载cdrom unmount /cdrom二、备份和恢复rootvg备份 mksysb只备份rootvg只备份已挂接文件系统以备份格式创建可开启磁带保留rootvg中换页空间设备定义保留逻辑卷策略备份时应使活动用户和应用减至最少注:mksysb创建操作系统备份,假如rootvg中有用户创建文件系统,只要它已挂接,也被备
5、份,用户创建不含文件系统逻辑卷内容及定义不备份。mksysb创建备份磁带是可开启,并能够进行BOS安装。从磁带恢复rootvg备份时,全部文件系统被恢复,开启逻辑卷自动创建,文件系统日志设备根据默认大小(一个逻辑分区)创建,依据保留换页空间设置生成一样大小换页空间设备。用户能够用一个系统上生成rootvg备份恢复到另一系统上,前提是两个系统结构相同,总线结构不一样(MCA和PCI)或SMP(支持多CPU)和非SMP(只支持一个CPU)系统间不能进行上述操作。# smit mksysbCreation of a MAP file:是否为卷组中每个要备份逻辑卷生成逻辑分区到物理分区映像文件。这个映
6、像文件能够使恢复时逻辑卷策略和逻辑分区到物理分区映射关系保持相同。提议创建。EXCLUDE files:假如选择yes,将使得文件/etc/exclude.rootvg文件中列出文件和目录不被备份。Make BOOTABLE backup:是否生成可开启备份,通常取默认值yes。EXPAND /tmp if needed:是否在需要时自动扩展/tmp文件系统。强烈提议选yes。Number of BLOCKS to write in a single output:选择每次写出数据量,以512字节块为单位。非rootvg卷组备份# smit savevg恢复rootvg备份依据从磁带安装操作系
7、统步骤用mksysb磁带开启Welcome to Base Operting SystemInstallation & Maintenance 1 Start Install Now With Default Settings 2 Change/Show Installation Settings and Install 3 Start Maintenance Mode for System RecoveryMaintenance 1 Access A Root Volume Group 2 Copy a System Dump to Removable Media 3 Access Adva
8、nced Maintenance Functions 4 Install from a System BackupChoose Tape Drive Tape DrivePath Name 1 tape/scsi/4mm/12GB/dev/rmt0恢复非rootvg卷组备份# smit restvg依文件名备份-smit屏幕# smit backfile其它UNIX备份命令tar (tape archive)适用范围广很适合在不一样UNIX平台间传送文件可恢复空目录(-d选项)不支持AIX访问控制列表(ACL,属于扩展inode内容)cpio(copy input to output)适用范围
9、广符号链接较多时可能不能正常工作不支持AIX访问控制列表(ACL,属于扩展inode内容)dd(device to device)创建正确相同备份映像,可用于正确备份逻辑卷可用于转换一些内容(比如大小写、ASCII和EBCDIC互转等)三、AIX安全控制增加快速文件/var/adm/wtmp/var/spool/*/*/smit.log/smit.script/etc/security/failedlogin/var/adm/sulog显示文件和目录空间占用量du /home |sort rn安全性统计文件/var/adm/sulog统计每次su命令实施。这是个文本文件。使用任何观看文本文件命
10、令查看。/var/adm/wtmp和/etc/utmp统计用户成功登录。使用who命令查看。/etc/security/failedlogin统计全部不成功登录尝试。假如用户名不存在,统计为UNKNOWN项目。使用who命令查看。安全性相关文件包含用户属性和访问控制文件/etc/passwd正当用户(无口令内容)/etc/group正当用户组/etc/security/passwd含有加密形式用户口令/etc/security/user用户属性,口令限制/etc/security/limits对用户限制/etc/security/environ用户环境设定/etc/security/login
11、.cfg登录设置/etc/security/group用户组属性用户环境正当性检验和修正检验/etc/passwd/和/etc/security/passwd一致性,和/etc/security/login.cfg和/etc/security/user,同时修正错误:pwdck -y ALL检验/etc/security/user、/etc/security/limits、/etc/security/passwd,和是否每个组在/etc/group和/etc/security/group中全部有对应条目,并修正错误:usrck -y ALL检验/etc/group、/etc/security/
12、group、/etc/passwd和/etc/security/user中相关用户组内容一致性,并修正错误:grpck -y ALL四、错误日志查看全部AIX错误全部统计在一个统计文件中/var/adm/ras/errlog显示错误 errpt -a -a 为具体显示能够输出到文件或用more、pg察看清空错误统计信息errclear 0建立/修改口令经过errpt产生错误汇报显示全部错误汇报# errpt只汇报硬件错误# errpt -d -H描述ID为F49E2A17错误汇报# errpt -a -j F49E2A17例:# errpt 标识C:错误归类H:硬件S:软件O:操作错误U:不能
13、确定标识T:错误类型PERM(而且C为H):显示系统碰到硬件问题而且无法自动修复PERD(而且C为H):系统硬件变为不可用并引发一系列错误系统PERM(而且C为S):显示系统碰到软件问题而且无法自动修复TEMP(而且C为S):显示系统碰到软件问题而且已经自动修复root用户经过手工命令errclear直接清除错误日志# errclear 10清除10天以前全部日志# errclear -d H 0清除全部硬件错误# errclear -N disk 0删除全部资源组为disk统计# errclear -T UNKN 0删除全部类型为unknown统计# errclear 0删除全部统计显示er
14、ror log特征# /usr/lib/errdemon -lError Log Attributes-Log File /var/adm/ras/errlogLog Size 1048576 bytesMemory Buffer Size 8192 bytes 五、Performance Tools常见命令# ps# sar# vmstat# iostat# tprof# svmon# filemon例:CPU使用情况(sar u)这条命令语法是:# sar options interval number比如:# sar u 60 3AIX NODE 2 3 00000211 07/06/9
15、9%usr%sys%wio%idle08:25:1148520008:26:1063370008:27:12594100.Average564400当 %usr+%sys 80% 时,CPU 担心查看运行队列(sar q)这条命令语法是:# sar options interval number比如:# sar q 60 3AIX NODE 2 3 00000211 07/06/9908:41:21runq-sz%runoccswap-sz%swpocc08:42:211.210008:43:211.010008:44:211.1100.Average1.2100注:命令#sar q输出:-r
16、unq-sz = 运行队列平均长度。(运行队列平均长度就是等候在队列中进程数目)-%runocc = 运行队列被占用时间百分比。-swap-sz = 等候被内存页交换进程平均数目。-%swapocc = 内存页交换队列被占用时间百分比。这些数据会更有意义,假如搜集一段时间而且研究它趋势。在有些环境下能够接收庞大运行队列,而另外环境就不一定适用。比如,在一个传统商业环境中,进程全部是简单而运行快速,这时系统性能还能够忍受大运行队列。而在一个工程或科学计算环境中,进程通常全部是巨大且需要更密集资源,此时就不能忍受大运行队列。Paging 信息# vmstat 1 3注:命令vmstat输出:-pr
17、ocs =(每秒)r在运行队列中进程b在等候队列中进程-memory =( 那个时刻统计数据)avm活动虚拟页数目fre在空闲列表中物理内存槽数-page =(每秒)re收回页pi/po交换进内存页/交换出内存页fr/sr空闲页/被时钟计算法则检测页cy时钟循环(通常为0)-faults =(每秒)in设备中止数sy系统调用数cs上下文交换数-cpu =(就象命令sar u,为百分比)us用户进程sy关键进程id空闲时间waI/O等候时间这些信息是sar汇报补充。wa假如超出25,那么磁盘子系统可能没有平衡好。和AIX存放相关基础概念lPV:Physical Volume物理卷lVG:Volume Group 卷组lPP: Physical Partition物理分区lLP:Logical Partition 逻辑分区lLV:Logical Volume 逻辑卷lLVM:Logical Volume Manager逻辑卷管理器