1、Teradata系统日常维护手册52020年4月19日文档仅供参考数据仓库系统日常维护标准文档下面列表内容为日常维护检查系统的具体情况:序号项目详细操作结果1了解系统运行状况向系统管理员了解系统有无异常等2查看全系统状态SWS console,查看全系统状况3查看全系统日志打开 SWS fault Viewer查看报错信息4查看阵列状况Symplicity5查看AWS文件系统删除过期的大文件和临时文件6记录检查信息Script PM_date.out7查看空间节点情况Psh dfspace or df k 8查看节点日志1, less /var/log2, errpt f /var/adm/s
2、treams/* |pg9查看系统运行时间检查系统运行时间(who b或uptime)10检查bynet连接检查bynet连接(bam s)11检查数据库状态psh pdestate a查看数据库状态vprocmanagerstatus notvprocmanager s12查看dump1, 检查pdedump区上的dumpcsp mode list2, 检查数据库内的dumpcsp mode list source table保存必要的dump,删除无用的dump13检查数据库空间使用情况Exec disksum14检查数据库物理空间使用检查数据库物理空间使用情况 (script /tmp/
3、showspace09*.txtcnsterm 6 ferret showspace)15检查数据库的倾斜度sel databasename, tablename, sum(currentperm)/1024/1024/1024, 1-avg(currentperm)/max(currentperm) from dbc.tablesize group by 1, 2 having 1-avg(currentperm)/max(currentperm)0.5 and sum(currentperm)/1024/1024/1024516检查nv serverNA17检查netvualt的各个日志,
4、以及备份任务有没有报错NA18关闭TVIAWS TVI软件打开TVI service 窗口。19更换能够在线更换的部件如硬盘,电源等20通知客户关闭数据库Tpareset x comments(检查WAL和session情况)重启前只要wal基本都归零了不必要清session,只有wal有问题才需要做步骤2.1,psh pdestate 看是不是所有节点都正常的。 登出所有用户:(登出前跟客户联系一下。)# cnsterm 6 open the database supervisor screenInput Supervisor Command: abort session *.* logof
5、fIs the data base quiescent? (Verify all sessions are gone.)# /tpasw/bin/vprocmanager s DBS State: Logons are enabled The system is quiescent PDE State: TPAIf system is not quiescent (still users are logged on), perform a dbs coldwait restart from vprocmanager. Otherwise continue with “Bring databas
6、e down”:# /tpasw/bin/vprocmanagerEnter a command, HELP or QUIT:restart coldwait to clear session tableWait for the database to come up again. Is the data base quiescent? (Verify all sessions are gone.)# /tpasw/bin/vprocmanager s DBS State: Logons are enabled The system is quiescentPDE State:TPA 检查wa
7、l的大小:(bteq登录,systemfe|service)selectcurrentperm,vprocfrom dbc.tablesizewhere databasename = DBCand tablename = transientjournalorder by 1 desc;4,# vprocmanager status not quit-应该没有amp显示出来。5,# ctl (Linux) screen debug 0=off write quit6,# tpareset f restarttdcs7,等所有的启动完成后,确认所有的node状态是TPA/READY。在PDN NO
8、DE上运行:# psh pdestate8,# vprocmanager status not quit-应该没有amp显示出来。9,停数据库:# tpareset x stopDB10,psh pdestate-null/stop21关闭需要维护的节点更换配件22如果超过1个月未重启,重启其它节点。Shutdown y g0 i623检查所有节点情况Memsize cpuinfo dkconfig las bam s verify_pdisk24检查系统时间如有必要同步系统时间25检查客户网路连接确认PLAN/SLAN/CLAN所有网络正常(ildconfig)26检查备份服务器NA27清除
9、光纤统计计数光纤卡和controller的psh /opt/lsiUtil/lsiUtil r登录controller(infiniti)-fcall fc 9028启动数据库确认数据库状态logon enabled1经过SYMplicity管理工具确认所有的阵列都是optimal状态2确认Teradata所有的pdisk是online状态的。从PDN节点运行: # psh -t 120 verify_pdisks 3检查所有节点PDE的状态 # psh pdestate4所有节点的PDE应该都是TPA/READY状态。如果有的PDE状态不是TPA/READY,启动PDE并再次确认状态。使用如
10、下命令: # psh “/etc/init.d/tpa start” # psh pdestate5使用Vprocmanager工具来确认所有的VPROC状态是online的: # tdatcmd vprocmanager status not quit -应该没有amp显示出来。6设置Start DBS 标识为“on”,从控制节点的设置这个标识: # ctl (Linux/Windows) screen debug 0=on write quit7重启Teradata的DBS: # tpareset f resettd8确认所有的PDE状态是TPA的。运行: # psh pdestate9确认所有节点的VPROC状态是online的,而且登录是激活的: # vprocmanager status not status sysstate quit29执行packdisk如有必要执行cnsterm 6 start ferret packdisk FSP=1530重启SWS31运行SHR1.2/home/support/run_shr12.pl32如果有软件或硬件变化运行shr333如果更换了电池34取出相关信息文件35系统交付客户使用36检查现场备件情况37是否有未解决的问题请注明无38备注