1、Solaris系统恢复操作步骤指南 连接串口线到HLR主机 1. 将‘25转RJ45’接头插在SUN服务器的串口上“A”位置; 将‘9转RJ45’接头(串口配置器)插终端PC机的串口1; 用普通网线连接两接头 SCDMA HLR主机目前采用的是Solaris操作平台,因为没有配置显卡,所以,工程人员到现场时,务必带上‘25转RJ45’和‘9转RJ45’两个接头。如果发生异常停机,重新加电SUN服务器仍不能正常启动。请按照以下步骤操作,操作时要避免任何有带电插拔的动作。 确保PC机和Solaris至少有一个处于关闭电源状态,将‘25转RJ45’接头插在SUN服务器的串口上“A”位
2、置。 注: SUN F280R服务器背面最左下角25针接口,上标有A字样。 (此专用串口线已于2006年9月4日下午交给广西网通冯建武保管) 2. 启动sun服务器 3. 在终端PC机运行“超级终端” 名称 ——sun 连接时使用 ——com1 端口设置 ——[还原默认值] 然后[确定],回车,应该看到sun服务器输出的终端信息 SUN服务器系统恢复具体处理步骤: 如果console出现登录提示,用帐户root,口令 **** 登录,如登陆成功,则转下面的附件2,HLR应用程序启动步骤。 1、 如果系统不能正常引导,磁盘阵
3、列需要人工手工修复,则显示如下信息: Type control-d to proceed with normal startup, (or give root password for system maintenance): 该界面要求用户输入root用户密码,进入单用户模式。 如果登陆成功,则转步骤5。 2、 如果显示ok,如下,则输入go命令回车,让系统继续引导。 ok go (回车) 观察是否最终出现正常的登陆界面: shlr0 console login: Password: 3、 磁盘阵列或硬盘超级块错误 BAD SUPER BL
4、OCK: MAGIC NUMBER WRONG USE AN ALTERNATE SUPER-BLOCK TO SUPPLY NEEDED INFORMATION; 具体修复方法请参见附录1。 4、 如果不是上述的任何界面,而且服务器运行有问题不能正常远程telnet登陆,请立即与公司研发人员取得联系。 5、 系统不能引导的处理步骤如下: 如果输入了不正确的密码,则系统显示信息如下,继续维持在口令输入界面: Type control-d to proceed with normal startup, (or give root password for sy
5、stem maintenance): Login incorrect 如果输入了正确的密码,则进入系统,显示信息如下,可以继续输入维护命令: Type control-d to proceed with normal startup, (or give root password for system maintenance): single-user privilege assigned to /dev/console. Entering System Maintenance Mode Sep 3 02:45:48 su: 'su root' succeeded
6、 for root on /dev/console
Sun Microsystems Inc. SunOS 5.8 Generic Patch October 2001
You have new mail.
#
此时需要人工输入命令修复磁盘,请输入如下命令:
# format (该条命令是显示系统磁盘和阵列的物理设备号的命令)
Searching for disks...done
AVAILABLE DISK SELECTIONS:
0. c1t0d0 7、4>
/pci@8,600000/SUNW,qlc@4/fp@0,0/ssd@w2100000c50568f03,0
1. c2t0d0 8、ns.
注:1. c2t0d0 9、current disk
format - format and analyze the disk
repair - repair a defective sector
label - write label to the disk
analyze - surface analysis
defect - defect list management
backup - search for backup labels
ver 10、ify - read and display labels
save - save new disk/partition definitions
inquiry - show vendor, product and revision
volname - set 8-character volume name
! 11、fsck -y /dev/rdsk/c2t0d0s2;reboot
注:c2t0d0是根据上面的format命令查出的,不同的服务器磁盘阵列的物理设备号可能不同,这里需要特别注意。需根据format显示的物理设备号然后进行修复。
** /dev/rdsk/c1t0d0s0
** Currently Mounted on /
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference 12、 Counts
** Phase 5 - Check Cyl groups
7440 files, 5060915 used, 17086158 free (4422 frags, 2135217 blocks, 0.0% fragmentation)
FILE SYSTEM IS CURRENTLY MOUNTED. CONTINUE? yes
…… (省略中间若干界面自动输出信息)
syncing file systems... done
rebooting...
Resetting ...
以下信息则是服务器硬盘已经成功修复,并且正常启 13、动的界面:
@(#)OBP 4.5.21 2003/02/24 17:23 Sun Fire 280R
...... (省略中间若干界面自动输出信息)
volume management starting.
The system is ready.
shlr0 console login: (见到该界面,则表示服务器已经恢复正常)
Password:
Sep 3 04:07:45 shlr0 login: ROOT LOGIN /dev/console
Last login: Sun Sep 3 04:02:05 on console
Sun Microsyst 14、ems Inc. SunOS 5.8 Generic Patch October 2001
You have new mail.
#
正确输入用户名口令,则可以正常进入系统,进行维护或者启动应用程序。
(启动HLR应用程序步骤请参见附录2)
附录1:阵列及硬盘超级块出错的恢复步骤:
问题描述:Sun服务器在运行时掉电了,重新启动HLR时报错:
BAD SUPER BLOCK: MAGIC NUMBER WRONG
USE AN ALTERNATE SUPER-BLOCK TO SUPPLY NEEDED INFORMATION;
原因为服 15、务器异常断电后,磁盘阵列超级块被破坏,此时应该使用另外的超级块进行恢复工作。
先用format等命令确认原始物理设备号。
#format
显示结果中有:
Searching for disks...done
AVAILABLE DISK SELECTIONS:
0. c1t0d0 16、0-0316 cyl 35001 alt 2 hd 64 sec 64>
/pci@8,700000/scsi@6,1/sd@0,0
Specify disk (enter its number): 0
selecting c1t0d0
[disk formatted]
Warning: Current Disk has mounted partitions.
ISD-PinnacleRAID400-0316即为所要恢复的设备名称。
如果想知道哪些备份超级块可用,执行
newfs -Nv /dev/rdsk/c2t0d0s2
命令输出如下:
/dev 17、/rdsk/c2t0d0s0: 20484288 sectors in 2013 cylinders of 24 tracks, 424 sectors 10002.1MB in 202 cyl groups (10 c/g, 49.69MB/g, 6016 i/g)
super-block backups (for fsck -F ufs -o b=#) at:
32, 102224, 204416, 306608, 408800, 510992, 613184, 715376, 817568,
…… (中间省略若干)
20048912, 20151104, 20253296, 2 18、0355488, 20457680,
找出原根文件系统所有备份超级块号 ,将会看到大量的备份超级块号,记录下某任意一个备份的超级块号,如第一个32这个备份超级块号。
fsck -y -F ufs -o b=32 /dev/rdsk/c2t0d0s2
按照提示覆盖原超级块,遇到系统提问时按“y”键确认。
Alternate super block location: 32.
** /dev/rdsk/c2t0d0s0
** Last Mounted on
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check 19、 Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference Counts
** Phase 5 - Check Cyl groups
FREE BLK COUNT(S) WRONG IN SUPERBLK
SALVAGE? y
103392 files, 4506935 used, 5580053 free (8917 frags, 696392 blocks, 0.0% fragmentation)
***** FILE SYSTEM WAS MODIFIED *****
fsc 20、k执行完成后磁盘阵列应可以正常mount,执行
mount /dev/dsk/c2t0d0s2 /disk1
进入/disk1目录,如果/disk1目录内有hlr.use文件将其删除。
完成以上操作后按正常启动步骤启动HLR。
如果是SUN服务器的硬盘超级块坏,找一张Solaris安装光盘
Stop-A进入OBP状态,在ok提示符下输入
ok> boot cdrom -s
进入单用户模式。此时原有根文件系统并未mount上来,也不需要mount原有根文 件系统,直接类似上面的操作进行恢复。
附录2:SUN服务器修复后HLR 21、程序的加载过程:
(1) 从维护台用telnet连接主机并用root登陆
(2) 用oracle登录系统
(3) %su - 转为超级用户
(4) #cd /shlr 到运行目录下
(5) #./shlrgo& 以后台方式执行程序,并检查输出
主用侧最终会输出
**Doub:================
**Doub: Upgrading ok
**Doub:================
备用侧最终会输出
**Doub:Memory trans end.
否则:
22、 (i)若console出现“peer running, abort...”字样,则:
a. ps -el|grep hlr ,得到shlrgo和hlrtest的PID
b. kill -9 **** (分别是shlrgo和hlrtest的PID进程号)
c. cd /disk1
d. rm hlr.use
e. cd /shlr 到运行目录下
f. ./shlrgo& 23、 以后台方式执行程序,并检查输出
(ii)若console出现“mount failure”字样,则:
a. format,记录阵列盘ID,如c2t4d0
b. fsck –y /dev/dsk/c2t4d0s2 等待修复完毕,再执行
c. mount /dev/dsk/c2t4d0s2 /disk1
d. cd /disk1
e. rm hlr.use
f. cd /shlr 到运行目录下
g. ./shlrgo& 以后台方式执行程序,并检查输出
操作c如果出错,请参考附录1,并与公司研发人员取得联系。
(6) #exit 退出超级用户
(7) 关闭telnet






