资源描述
Solaris系统恢复操作步骤指南
连接串口线到HLR主机
1. 将‘25转RJ45’接头插在SUN服务器的串口上“A”位置;
将‘9转RJ45’接头(串口配置器)插终端PC机的串口1;
用普通网线连接两接头
SCDMA HLR主机目前采用的是Solaris操作平台,因为没有配置显卡,所以,工程人员到现场时,务必带上‘25转RJ45’和‘9转RJ45’两个接头。如果发生异常停机,重新加电SUN服务器仍不能正常启动。请按照以下步骤操作,操作时要避免任何有带电插拔的动作。
确保PC机和Solaris至少有一个处于关闭电源状态,将‘25转RJ45’接头插在SUN服务器的串口上“A”位置。
注: SUN F280R服务器背面最左下角25针接口,上标有A字样。
(此专用串口线已于2006年9月4日下午交给广西网通冯建武保管)
2. 启动sun服务器
3. 在终端PC机运行“超级终端”
名称 ——sun
连接时使用 ——com1
端口设置 ——[还原默认值]
然后[确定],回车,应该看到sun服务器输出的终端信息
SUN服务器系统恢复具体处理步骤:
如果console出现登录提示,用帐户root,口令 **** 登录,如登陆成功,则转下面的附件2,HLR应用程序启动步骤。
1、 如果系统不能正常引导,磁盘阵列需要人工手工修复,则显示如下信息:
Type control-d to proceed with normal startup,
(or give root password for system maintenance):
该界面要求用户输入root用户密码,进入单用户模式。
如果登陆成功,则转步骤5。
2、 如果显示ok,如下,则输入go命令回车,让系统继续引导。
ok go (回车)
观察是否最终出现正常的登陆界面:
shlr0 console login:
Password:
3、 磁盘阵列或硬盘超级块错误
BAD SUPER BLOCK: MAGIC NUMBER WRONG
USE AN ALTERNATE SUPER-BLOCK TO SUPPLY NEEDED INFORMATION;
具体修复方法请参见附录1。
4、 如果不是上述的任何界面,而且服务器运行有问题不能正常远程telnet登陆,请立即与公司研发人员取得联系。
5、 系统不能引导的处理步骤如下:
如果输入了不正确的密码,则系统显示信息如下,继续维持在口令输入界面:
Type control-d to proceed with normal startup,
(or give root password for system maintenance):
Login incorrect
如果输入了正确的密码,则进入系统,显示信息如下,可以继续输入维护命令:
Type control-d to proceed with normal startup,
(or give root password for system maintenance):
single-user privilege assigned to /dev/console.
Entering System Maintenance Mode
Sep 3 02:45:48 su: 'su root' succeeded for root on /dev/console
Sun Microsystems Inc. SunOS 5.8 Generic Patch October 2001
You have new mail.
#
此时需要人工输入命令修复磁盘,请输入如下命令:
# format (该条命令是显示系统磁盘和阵列的物理设备号的命令)
Searching for disks...done
AVAILABLE DISK SELECTIONS:
0. c1t0d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
/pci@8,600000/SUNW,qlc@4/fp@0,0/ssd@w2100000c50568f03,0
1. c2t0d0 <ISD-PinnacleRAID400-0316 cyl 35001 alt 2 hd 64 sec 64>
/pci@8,700000/scsi@6,1/sd@0,0
Specify disk (enter its number): 0
selecting c1t0d0
[disk formatted]
Warning: Current Disk has mounted partitions.
注:1. c2t0d0 <ISD-PinnacleRAID400-0316 cyl 35001 alt 2 hd 64 sec 64>
重体部分表示阵列的型号,前面的c2t0d0表示它的物理设备号
FORMAT MENU:
disk - select a disk
type - select (define) a disk type
partition - select (define) a partition table
current - describe the current disk
format - format and analyze the disk
repair - repair a defective sector
label - write label to the disk
analyze - surface analysis
defect - defect list management
backup - search for backup labels
verify - read and display labels
save - save new disk/partition definitions
inquiry - show vendor, product and revision
volname - set 8-character volume name
!<cmd> - execute <cmd>, then return
quit
format> q (输入q回车退出该界面)
# fsck -y;fsck -y /dev/rdsk/c2t0d0s2;reboot
注:c2t0d0是根据上面的format命令查出的,不同的服务器磁盘阵列的物理设备号可能不同,这里需要特别注意。需根据format显示的物理设备号然后进行修复。
** /dev/rdsk/c1t0d0s0
** Currently Mounted on /
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference Counts
** Phase 5 - Check Cyl groups
7440 files, 5060915 used, 17086158 free (4422 frags, 2135217 blocks, 0.0% fragmentation)
FILE SYSTEM IS CURRENTLY MOUNTED. CONTINUE? yes
…… (省略中间若干界面自动输出信息)
syncing file systems... done
rebooting...
Resetting ...
以下信息则是服务器硬盘已经成功修复,并且正常启动的界面:
@(#)OBP 4.5.21 2003/02/24 17:23 Sun Fire 280R
...... (省略中间若干界面自动输出信息)
volume management starting.
The system is ready.
shlr0 console login: (见到该界面,则表示服务器已经恢复正常)
Password:
Sep 3 04:07:45 shlr0 login: ROOT LOGIN /dev/console
Last login: Sun Sep 3 04:02:05 on console
Sun Microsystems Inc. SunOS 5.8 Generic Patch October 2001
You have new mail.
#
正确输入用户名口令,则可以正常进入系统,进行维护或者启动应用程序。
(启动HLR应用程序步骤请参见附录2)
附录1:阵列及硬盘超级块出错的恢复步骤:
问题描述:Sun服务器在运行时掉电了,重新启动HLR时报错:
BAD SUPER BLOCK: MAGIC NUMBER WRONG
USE AN ALTERNATE SUPER-BLOCK TO SUPPLY NEEDED INFORMATION;
原因为服务器异常断电后,磁盘阵列超级块被破坏,此时应该使用另外的超级块进行恢复工作。
先用format等命令确认原始物理设备号。
#format
显示结果中有:
Searching for disks...done
AVAILABLE DISK SELECTIONS:
0. c1t0d0 <SUN72G cyl 14087 alt 2 hd 24 sec 424>
/pci@8,600000/SUNW,qlc@4/fp@0,0/ssd@w2100000c50568f03,0
1. c2t0d0 <ISD-PinnacleRAID400-0316 cyl 35001 alt 2 hd 64 sec 64>
/pci@8,700000/scsi@6,1/sd@0,0
Specify disk (enter its number): 0
selecting c1t0d0
[disk formatted]
Warning: Current Disk has mounted partitions.
ISD-PinnacleRAID400-0316即为所要恢复的设备名称。
如果想知道哪些备份超级块可用,执行
newfs -Nv /dev/rdsk/c2t0d0s2
命令输出如下:
/dev/rdsk/c2t0d0s0: 20484288 sectors in 2013 cylinders of 24 tracks, 424 sectors 10002.1MB in 202 cyl groups (10 c/g, 49.69MB/g, 6016 i/g)
super-block backups (for fsck -F ufs -o b=#) at:
32, 102224, 204416, 306608, 408800, 510992, 613184, 715376, 817568,
…… (中间省略若干)
20048912, 20151104, 20253296, 20355488, 20457680,
找出原根文件系统所有备份超级块号 ,将会看到大量的备份超级块号,记录下某任意一个备份的超级块号,如第一个32这个备份超级块号。
fsck -y -F ufs -o b=32 /dev/rdsk/c2t0d0s2
按照提示覆盖原超级块,遇到系统提问时按“y”键确认。
Alternate super block location: 32.
** /dev/rdsk/c2t0d0s0
** Last Mounted on
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference Counts
** Phase 5 - Check Cyl groups
FREE BLK COUNT(S) WRONG IN SUPERBLK
SALVAGE? y
103392 files, 4506935 used, 5580053 free (8917 frags, 696392 blocks, 0.0% fragmentation)
***** FILE SYSTEM WAS MODIFIED *****
fsck执行完成后磁盘阵列应可以正常mount,执行
mount /dev/dsk/c2t0d0s2 /disk1
进入/disk1目录,如果/disk1目录内有hlr.use文件将其删除。
完成以上操作后按正常启动步骤启动HLR。
如果是SUN服务器的硬盘超级块坏,找一张Solaris安装光盘
Stop-A进入OBP状态,在ok提示符下输入
ok> boot cdrom -s
进入单用户模式。此时原有根文件系统并未mount上来,也不需要mount原有根文 件系统,直接类似上面的操作进行恢复。
附录2:SUN服务器修复后HLR程序的加载过程:
(1) 从维护台用telnet连接主机并用root登陆
(2) 用oracle登录系统
(3) %su - 转为超级用户
(4) #cd /shlr 到运行目录下
(5) #./shlrgo& 以后台方式执行程序,并检查输出
主用侧最终会输出
**Doub:================
**Doub: Upgrading ok
**Doub:================
备用侧最终会输出
**Doub:Memory trans end.
否则:
(i)若console出现“peer running, abort...”字样,则:
a. ps -el|grep hlr ,得到shlrgo和hlrtest的PID
b. kill -9 **** (分别是shlrgo和hlrtest的PID进程号)
c. cd /disk1
d. rm hlr.use
e. cd /shlr 到运行目录下
f. ./shlrgo& 以后台方式执行程序,并检查输出
(ii)若console出现“mount failure”字样,则:
a. format,记录阵列盘ID,如c2t4d0
b. fsck –y /dev/dsk/c2t4d0s2 等待修复完毕,再执行
c. mount /dev/dsk/c2t4d0s2 /disk1
d. cd /disk1
e. rm hlr.use
f. cd /shlr 到运行目录下
g. ./shlrgo& 以后台方式执行程序,并检查输出
操作c如果出错,请参考附录1,并与公司研发人员取得联系。
(6) #exit 退出超级用户
(7) 关闭telnet
展开阅读全文