1、1.1设备巡检服务为了确保广州市工商局存储设备长期、稳定的工作,最大限度和降低系统的运行故障及延长系统设备的使用寿命,为项目组管理人员提供辅助决策的有效数据,维护项目组的服务工程师对广州市工商局存储设备提供定期的巡查及保养服务。项目IT设备维护工程师在日常工作中,除了处理日常维护工作以外,由被动服务变主动服务,主动到进行日常巡检巡查服务,通过日常巡检巡查服务排除故障隐患,降低故障率。并通过以往广州市工商局维护数据分析,详细总结广州市工商局存储设备的具体故障情况,并及时对故障多发和高发设备进行预防性巡查。每月的日常巡查主要包括以下内容:系统运行环境检查、机房温度,系统组件运行情况检查。系统错误日
2、志分析、文件系统空间使用情况检查。应用系统的优化、数据的整理、常见故障的排除。检查系统软件补丁情况。系统软件补丁升级,数据备份与恢复。服务器、存储设备的除尘处理。设备清洁保养:通过清洁保养服务,最大限度降低设备的故障率,延长设备的使用寿命,同时为广州市工商局数据中心的工作人员提供一个整洁、干净的工作环境。硬件设备运行情况巡检:了解和记录广州市工商局存储设备的最新使用情况(包括新增设备情况、已有设备的维修情况、耗材的使用情况、关键设备的运行情况等),检测设备的运行情况,排除故障发生隐患,最大限度的降低存储设备硬件的故障发生率,对一些经常出现故障的设备和关键设备要进行重点的检查。同时对一些已老化或
3、需淘汰的设备进行记录并向项目组进行反映、提出备机建议。系统及软件运行情况巡查:系统的优化、数据的整理、常见故障的排除;服务器病毒的查、杀、防毒软件的定期升级;提供系统软件的升级。系统数据的备份与恢复。时间是每季度一次,范围是服务器和存储设备等此次合同中涉及到的所有的硬件、系统和应用软件,工作内容是进行所有设备和软件的健康检查,目的是详细的查看与解决其存在的故障隐患。首先由我公司的项目经理填写巡检申请表向广州市工商局提出巡检申请,在批准后1到2天内,开始巡检,在巡检过程中,按照巡检报告中涉及的项目进行详细的检查,如果在巡检的过程中,遇到需要更换硬件设备的情况,电话通知配件仓库,进行配件更换。如果
4、遇到无法解决的故障问题(如系统或软件的bug问题等),我司会通知用户的同时,提升服务等级,寻求厂家的技术支持,并最终找到解决方案。在解决故障后,我司工程师会填写现场维护单、备件更换记录表、BaseLine信息表,在巡检结束后,我司工程师会填写巡检报告,并且每季度向广州市工商局提供一次巡检总结报告。其流程如下:图。服务器的健康检查存储设备的健康检查1)存储系统巡检描述随着设备的使用寿命,以及生产业务信息的增加和不断变化的计算机系统将会危及任何技术环境的稳定性,进而影响用户的业务。我司定期的健康检查可以通过确定性能降低、可用性故障点和安全隐患来保护用户的业务,因此用户可以防患系统故障,提高用户的工
5、作效率。训练有素的工程师将对用户运行操作系统的当前服务器系统状态进行“大图片”快照,在不中断操作的情况下,快速、经济高效地评估用户的主机系统和存储备份系统的环境和应用。采用专业化的基础工具来采集和衡量系统数据,并进行上百次测试,将用户的系统操作与最佳的管理案例进行对比,从而确定最佳的应用方案和最佳运行环境。2)存储系统巡检主要内容介绍建立BASELINE信息档案搜集主机系统和存储备份系统,在正常运行的情况下的所有软硬件信息,并建立归档 全面而准确的系统评估执行系统健康检查的小组经过了全方位的培训,包括影响系统性能的因素、用于衡量性能的工具、以及可最大限度提高IT投资回报的解决方案等。 数据采集
6、基于系统的工具可以在独立或Cluster统上广泛采集数据。金税技术专家可在现场检索数据,也可以在中心处进行远程采集。无论采用哪种方式,都只需要最少的系统资源,而且不必隔离正在进行检测的系统和网络。数据分析通过上百次自动测试,将所采集的有关系统磁盘性能、I/O通信、Cluster文件使用、配置和安全的数据与逾百种最佳管理规则和案例标准进行对比。标准化系统健康检查报告金税将把用户的系统健康检查结果整理成一篇清晰的文档,并与用户一起进行彻底的评审。总结报告将列出有关系统总体状态,包括配置设置与系统操作的评估,以及有关系统、磁盘性能、I/O通信、软件版本、可用性和安全性的信息。此外,还提供改进方案和纠
7、正措施的详细建议。 跟进咨询根据保修的服务项目,金税专家将在提交系统健康检查报告之后,为用户提供电话或现场咨询服务,使用户有机会对系统进行全面的技术评审,并对系统健康检查结果进行讨论。我司的系统健康检查可以对广州市工商局主机系统和备份存储系统上的潜在的问题进行一个广泛的深入检查。主机系统发生问题之前,它可以对系统上有关安全性,可管理性以及系统性能进行检查分析,并指出系统潜在的问题以及推荐解决方法。金税的系统健康检查是以一份报表形式呈现于客户面前,金税的技术专家将协助客户分析这份报告并提出应对的措施。日常管理机制的建立建立良好的维护和管理机制,通常日常的管理工作可以记录系统的低级故障,避免性能问
8、题出现。升级方案及支持当广州市工商局所用的操作系统有更新的版本出现;或者广州市工商局使用的应用软件需要更新的操作系统支持;或者有更新的硬件部件可以应用到广州市工商局主机系统上时,我司将会及时向广州市工商局做出通知并根据客户的实际情况作出升级的方案,以确保主机系统总是运行在良好的状态。补丁通知及推荐我司的服务包括向广州市工商局通知适用于他们系统上的补丁并建议怎样对他们的系统下补丁。这样,将使主机系统不断得到性能上的改善。现场管理指南我们对客户的现场提供专业的指导建议,使客户系统运行更加稳定。印制服务热线电话表,发放到最终用户;装订专业服务指南手册,并亲自送到客户手中;配合客户完成合同外的工作。3
9、) 存储设备的健康检查备份系统和数据1. HP-U*操作系统:卷组vg这部分内容主要包括一些HP-U*用到的文件系统,如/, /opt, /var,/tmp, /usr,/home, /stan(通常这些文件系统位于vg中。备份的方法:1) . make_recovery此命令备份整个根盘逻辑卷组,恢复时只需从备份的磁带引导,不需交互即可恢复整个根盘逻辑卷组信息。* make_recovery -A -C2) . fbackup* fbackup -0vi / -f /dev/rmt/0m -I /tmp/fbackupfiles/inde*/full.date +%y%m%d.%H:%W 2
10、 /tmp/fbackupfiles/log/ full.date +%y%m%d.%H:%M2. 系统配置文件对于系统一些关键性的文件或信息需要单独进行备份,这样有利于对系统进行恢复。这些文件或信息包括:1) .系统Swap信息* swapinfo -t2) .系统文件系统信息#bdf3) .系统的I / O信息* ioscan -fnCdisk4) . /etc/fstab5) .系统逻辑卷配置文件/etc/lvmconf/vg.conf vg01.conf vg02.conf这些逻辑卷配置文件可以用命令:vgcfgbackup / vgcfgrest生T成和恢复3. 应用数据及其他逻辑卷
11、如vg01、vg02等备份的方法:1) . tar* tar cvf /dev/rmt/0m /sample将目录/sample备份至磁带上2) . fbackup* fbackup -i /sample -e /sample/e*cept -f /dev/rmt/0m此命令用于备份除了 /sample/e*cep外的/sample文件系统到磁带机/dev/rmt/0m上4. 数据库的备份Informi*,oracle,syb等数据库都有自己的备份工具ontape,on-Achive,on-数据库数据的备份可依赖这些工具,或是将数据库用于存放数据的文件系统,逻辑卷用tar,fbackup,等
12、命令作备份。恢复系统和数据1. 用fbackup / t对系统进行备份时1) . Install Core-OS2) .恢复vg / vg01 / vg的备份内容* frecover -o -r -f /dev/rmt/0m2, 用make_recovery对系统进行备份时1) .用磁带boot system恢复vg详见make_recovery的恢复方法2) .恢复其它逻辑卷* frecover -o -r -f /dev/rmt/0m系统备份与恢复常用命令fbackup & frecover1. 系统备份命令:fbackup1) . fbackufe常用方式一:A. 进入单用户* shut
13、down -y 0* /etc/mount -aB. 系统全备份* fbackup -f /dev/rmt/0m -0v / -I /tmp/sysbk.inde*-f : 设备文件名 (such as DDS tape driver-i:要包含的目录-e 不包含的目录-I备份内容检索目录-v 备份内容详细列表-0:零级备份* fbackup -f /dev/rmt/0m -i / -e /home备份除了目录/home的所有目录C. 说明该命令方式对系统当前mounted ”的文件系统进行备份备份级别说明:备份级别有09个级别,如果当前系统采用零级备份,当下一次采用5级备份时,系统仅将会对有
14、变化的文件进行备份2) . fbacku的常用方式二:* mkdir -p /tmp/fbackupfiles/inde* mkdir -p /tmp/fbackupfiles/log* touch /tmp/fbackupfiles/inde*/full.date +%y%m%dMHA. 进入单用户* shutdown -y 0* /etc/mount -aB. 对系统进行全备份* fbackup -0vi / -f /dev/rmt/0m -I /tmp/fbackupfiles/inde*/full.date +%y%m%d%Hf 2 /tmp/fbackupfiles/log/ ful
15、l.date +%y%m%d.%MTC. 说明通过该方式可以知道系统备份需要的时间3) . fbacku的常用方式三:A. 进入单用户* shutdown -y 0* /etc/mount -aB. 对系统进行全备份* fbackup -0uv / -f /dev/rmt/0m -g /tmp/fbackupfiles/mygraph -I /tmp/fbackupfiles/inde*/full.date +%y%m%d%MH 2 /tmp/fbackupfiles/log/ full.date +%y%m%d.%EC. 说明文件mygraph:包含需要备份的目录,格式如下:i /users
16、/datai /home/appe /oracle/sql参数u:当备份系统成功时,系统将更新/var/adm/fbackupfiles/dates.4) . fbacku的常用方式四:备份远程系统A. 登录在本地系统时* remsh backup_sysname fbackup -f DDS_sysname /dev/rmt/0m -0v -i /B. 登录在远程系统时* fbackup -f DDS_sysname/dev/rmt/0m -0v -i /5) . fbacku的常用方式五:压缩方式备份(不建议使用、影响系统性能)A. 压缩方式备份* fbackup -0vi /dir -f
17、 - | compress | dd of=/dev/rmt/0m obs=10k“-”:指向标准输出B. 查看备份内容* dd if=/dev/rmt/0m ibs=10k | uncompress | frecover -I f -2. 系统恢复命令:frecover1) .恢复磁带机上所有内容:A. 进入单用户:* shutdown -y 0* /etc/mount -aB. 恢复数据* frecover -rf /dev/rmt/0m恢复磁带上的所有数据-f 设备文件名-r: 恢复磁带上的所有数据-I将磁带上文件索引存到指定的文件中* frecover -I /tmp/inde*.t*
18、t -f /dev/rmt/0m2) .恢复*一目录:* frecover -*i /directory* frecover -* -i /dir1 -i /dir2* frecover -*oi /dir-o 覆盖/dir下已有的、相同名称的文件* frecover -*v*i /dir-*相对与当前目录恢复数据,而不是按绝对路径恢复数据* cd /tmp/loqalfrecover -*vFi /dir-F:仅恢复文件,而不恢复到文件的路径例如:* cd /tmp/local* frecover -*vF -i /home/filename恢复结果/tmp/local/filen不e是 /
19、home/filename3) .从远程磁带机上恢复数据到本地:* frecover -*i /dir -f remote_n/dev/rmt/0m4) .从本地磁带机上恢复数据到远地系统:* remsh remote_name frecover -*i /dir -f loGal_/dem/rmt/0m”tar命令1. 对系统全备份* tar cvf /dev/rmt/0m /2. 备份*目录* tar cvf /dev/rmt/0m /tmp3. 改变文件的备份路径* tar cvf /dev/rmt/0m -C /tmp .Note:路径/tmp在磁带上的备份路径变为./* cd /tm
20、p* tar cvf /dev/rmt/0m ./*4. 恢复数据* tar *vf /dev/rmt/ (0m磁 带上所有数据)* tar *vf /dev/rmt/0m /tmp 恢复目录 /tmp )5. 查看磁带上的数据* tar tvf /dev/rmt/0m.3 SAM1. 备份数据* sam Select Backup and Recovery -Select Interactive Backup and Recovery -Select Backup Device Select Backup Files Interactively From Action menUs Selec
21、t Backup Scope Select Local File SystemsnQnNfS )Select”OK”注意:如果E*it code=2则备份可能是存在问题的。2).查看磁带上有哪些文件* frecover -rNsv -f /dev/rmt/0mmake_recovery1. 安装 Ignite-U* application1).从 HP-U* Application CD-ROM 上安装* swinstall SelectMark”A. 1.53 HP-U* Installation (Utliitlys-u* for 10.20-Select Analysis” Select
22、 Install”2) .从WebSite下载并安装,software.hp./Full backup started on host1: Wed oct 16 15: 10: 09 EAT 1998(Scheduled Backup) fbackup -0 -u -v -g /etc/sam/br/graphDCAa04366 -I/var/sam/log/br_inde*t.full-c /etc/sam/br/fbackup_config -d /var/adm/fbackupfiles/dates -f/dev/rmt/c1td0d0BEST 2&1Full backup comple
23、ted on host1: Wed Oct 16 16:44:01 EAT 1998E*it code=0Select“Network & System administrationDownload: ”(10.20 为 OS 版本)3) .从硬盘上安装:* cd /tmp* tar *vf /dev/rmt/0m4) .从磁带上安装:* dd if=/tmp/ignite-u*_10.20.tar of=/dev/rmt/0m bk=2* swinstall -s /dev/rmt/0m2. make_recovery*/opt/ignite/bin/make_recovery -AprvC
24、 -d destination -b boot-destination-A : 指定要备份整个 Root disk / Volume Group-p :预览备份过程,并不创建Bootable DDS Tapea 确认 /var/opt/ignite/recovery/mkrec.appe件db 创建 /var/opt/ignite/recovery/arch.in文件de-r :使用-p选项后,可以用该选项创建Bootable DDS Tape该选项可以识别 /var/opt/ignite/recovery/arch.in文件de-v :用于显示备份过程的提示信息-d :指定 DDS 的设备文
25、件名(default /dev/rmt/0mn )-b :指定系统备份过程中,用到的临时文件(default /var/tmp/u*instlf.recovry该文件大小为32M,对系统进行make_recovery时,要注意/var文件系统的大小,当/var文件系统大小不足时,可用如下命令对系统进行备份:* make_recovery -A -C -b /tmp/u*instlf.recovery-C :创建反映系统当前状态的文件:/var/opt/ignite/recovery/makrec.last如果该文件存在,则可以用check_recover命令3. 注意用make_recover
26、y备份的磁带是bootable磁带,用它可以安装OS。4. 备份系统Root Disk1) .创建最小 OS 的 bootable DDS tapedefaul设备文件:/dev/rmt/0mn )* make_recovery2) .创建最小 OS 的 bootable DDS tape(设备文件:/dev/rmt/c0t1d1BESTn )* make_recovery -d /dev/rmt/c0t1d1BESTn3) .先预览,再创建 bootable DDS tape* make_recovery -p* vi /var/opt/ignite/recovery/arch.includ
27、e* make_recovery r4) .复制整个Root Disk* make_recovery -A5) .复制整个Root Disk且生成反映系统当前状态的文件(/var/opt/ignite/recovery/makrec)last* make_recovery -C -A5恢复磁带上的所有数据1) 非交互式恢复系统A. 在磁带机中,插入系统恢复带B. Boot系统C. 中断Boot流程,进入Boot_admin提示下D. Boot_admin bo 8/8/:磁带机的 hardware pathE. 选取non-interactive “F. 等待系统恢复完毕2) .交互式恢复系统
28、A. 在磁带机中,插入系统恢复带B. Boot系统C. 中断Boot流程,进入Boot_admin提示下D. Boot_admin bo 8/8/:磁带机的 hardware pathE. 不选取non-interactive ,选取interactiveF. 选择Install HP-U* Advanced Installation 配置或改变如下选项:disks file systemshostname, IP ddre,stimezone root passwordDNS server and gatewayG. 选取install continue.,直到系统恢复完毕。11) 定时清洗
29、磁带机12) 用sar vmstat iosta命令来查看资源使用情况。13) 系统维护常用命令和常用工具系统管理工具SAM1.启动SAM软件安装工具swinstall1.运行swinstal启动安装进程磁带机的健康检查.1)外形主要介绍DDS 3磁带机1- Tape drive door2- 磁带状态灯3- 清洗/提示灯4- 弹出按钮2. 磁带机使用注意事项1) .磁带使用的寿命次数:1次左右2) .磁带机清洗带的使用频率:3) .强制性退出磁带:当按动“退出”按钮35秒后,磁带仍未退出,则按住“退出”按钮至少5秒钟,可以强制性退出磁带。3. 磁带机设备文件命名简介一些设备命名例子和意义:/
30、dev/rmt/c1t3d0BEST BEST = highest density possible/dev/rmt/c1t3d0sQIC150nb QIC-150 format, no rewind on close, Berkeley/dev/rmt/c1t3d0D8MM85C (Names can be quite descriptive)/dev/rmt/0m (For compatibility with the past)The components of /dev/rmt/c1t0d0BESTnb mean:dev = device filermt = raw magnetic
31、tapec1 = the device is connected to interface card instance 1t0 = the target device address is set to 0d0 = the tape transport resides at unit address 0,BEST = the tape will be written using the best available density/format(meaning pack as much onto this tape as is possible)n = the tape will not be rewound on closeb = the device will have Berkeley-style behavior