资源描述
数据仓库系统日常维护标准文档
下面列表内容为日常维护检验系统具体情况:
序号
项目
具体操作
结果
1
了解系统运行情况
向系统管理员了解系统有没有异常等
2
查看全系统状态
SWS console,查看全系统情况
3
查看全系统日志
打开 SWS fault Viewer查看报错信息
4
查看阵列情况
Symplicity
5
查看AWS文件系统
删除过期大文件和临时文件
6
统计检验信息
Script PM_date.out
7
查看空间节点情况
Psh dfspace or df –k
8
查看节点日志
1, less /var/log
2, errpt –f /var/adm/streams/* |pg
9
查看系统运行时间
检验系统运行时间(who –b或uptime)
10
检验bynet连接
检验bynet连接(bam –s)
11
检验数据库状态
psh pdestate –a查看数据库状态
vprocmanageràstatus not
vprocmanager –s
12
查看dump
1, 检验pdedump区上dump
csp –mode list
2, 检验数据库内dump
csp –mode list –source table
保留必需dump,删除无用dump
13
检验数据库空间使用情况
Exec disksum
14
检验数据库物理空间使用
检验数据库物理空间使用情况 (script /tmp/showspace09****.txtàcnsterm 6 àferret àshowspace)
15
检验数据库倾斜度
sel databasename, tablename, sum(currentperm)/1024/1024/1024, 1-avg(currentperm)/max(currentperm) from dbc.tablesize group by 1, 2 having 1-avg(currentperm)/max(currentperm)>0.5 and sum(currentperm)/1024/1024/1024>5
16
检验nv server
NA
17
检验netvualt各个日志,和备份任务有没有报错
NA
18
关闭TVI
AWS TVI软件à打开TVI service 窗口。
19
更换能够在线更换部件
如硬盘,电源等
20
通知用户关闭数据库
Tpareset –x comments(检验WAL和session情况)
重启前只要wal基础全部归零了无须要清session,只有wal有问题才需要做步骤2.
1,psh pdestate –看是不是全部节点全部正常。
Ø 登出全部用户:(登出前跟用户联络一下。)
# cnsterm 6 open the database supervisor screen
Input Supervisor Command:
Ø abort session *.* logoff
Is the data base quiescent? (Verify all sessions are gone.)
# /tpasw/bin/vprocmanager –s
DBS State: Logons are enabled – The system is quiescent
PDE State: TPA
If system is not quiescent (still users are logged on), perform a dbs coldwait restart from vprocmanager. Otherwise continue with “Bring database down”:
# /tpasw/bin/vprocmanager
Enter a command, HELP or QUIT:
restart coldwait to clear session table
Wait for the database to come up again. Is the data base quiescent? (Verify all sessions are gone.)
# /tpasw/bin/vprocmanager –s
DBS State: Logons are enabled – The system is quiescent
PDE State:TPA
Ø 检验wal大小:(bteq登录,systemfe|service)
select
currentperm
,vproc
from dbc.tablesize
where databasename = ‘DBC’
and tablename = ‘transientjournal’
order by 1 desc;
4,
# vprocmanager
> status not
> quit
---应该没有amp显示出来。
5,
# ctl (Linux)
> screen debug
> 0=off
> write
> quit
6,
# tpareset –f restarttdcs
7,等全部开启完成后,确定全部node状态是TPA/READY。在PDN NODE上运行:
# psh pdestate
8,# vprocmanager
> status not
> quit
---应该没有amp显示出来。
9,停数据库:
# tpareset –x stopDB
10,psh pdestate---null/stop
21
关闭需要维护节点
更换配件
22
假如超出1个月未重启,重启其它节点。
Shutdown –y –g0 –i6
23
检验全部节点情况
Memsize cpuinfo dkconfig –las bam –s verify_pdisk
24
检验系统时间
如有必需同时系统时间
25
检验用户网路连接
确定PLAN/SLAN/CLAN全部网络正常(ildconfig)
26
检验备份服务器
NA
27
清除光纤统计计数
光纤卡和controller
psh /opt/lsiUtil/lsiUtil –r
登录controller(infiniti)--fcall àfc 90
28
开启数据库
确定数据库状态logon enabled
1经过SYMplicity管理工具确定全部阵列全部是optimal状态
2确定Teradata全部pdisk是online状态。从PDN节点运行:
# psh -t 120 verify_pdisks
3检验全部节点PDE状态
# psh pdestate
4全部节点PDE应该全部是TPA/READY状态。假如有PDE状态不是TPA/READY,开启PDE并再次确定状态。使用以下命令:
# psh “/etc/init.d/tpa start”
# psh pdestate
5使用Vprocmanager工具来确定全部VPROC状态是online:
# tdatcmd vprocmanager
> status not
> quit
---应该没有amp显示出来。
6设置Start DBS 标识为“on”,从控制节点设置这个标识:
# ctl (Linux/Windows)
> screen debug
> 0=on
> write
> quit
7重启TeradataDBS:
# tpareset –f resettd
8确定全部PDE状态是TPA。运行:
# psh pdestate
9确定全部节点VPROC状态是online,而且登录是激活:
# vprocmanager
> status not
> status sysstate
> quit
29
实施packdisk
如有必需实施cnsterm 6 àstart ferretà packdisk FSP=15
30
重启SWS
31
运行SHR1.2
/home/support/run_shr12.pl
32
假如有软件或硬件改变运行shr3
33
假如更换了电池
34
取出相关信息文件
35
系统交付用户使用
36
检验现场备件情况
37
是否有未处理问题请注明
无
38
备注
展开阅读全文