1、xx TSM数据备份项目日常维护手册xxxxxx科技目录1序言32TSM巡检操作手册42.1查看TSM服务器42.2查看TSM manage console42.3在TSM服务器上登录到管理界面52.4在TSM client端检验63TSM常见问题处理63.1TSM Server故障处理63.1.1全部备份和恢复操作全部无法进行63.1.2怎样取得TSM错误描述73.1.3系统出现无法读写磁带或磁盘故障73.1.4处理带库故障后TSM工作不正常。83.1.5a tape in library does not display in q libv83.1.6reclaim process not
2、 run83.1.7how to delete archive log files after backup83.1.8windows device manager, found a drive mark as yellow93.2TSM Client故障处理93.2.1TSM Client无法连接TSM Server93.2.2TSM Client备份大文件时常常不成功93.2.3ANS1312E error in dsmerror.log103.2.4when backup data, error: media can not mount103.2.5ANR8779E Unable to
3、open drive mt0.3.0.3, error number=170104日常维护104.1开启和停止TSM服务器104.2进入管理员界面114.3进入TSM client文件备份/恢复界面114.4管理数据库和日志114.5管理磁带库124.5.1查看带库中磁带驱动器状态:124.5.2磁带分配:124.5.3检验活动日志,有可能要求作出回应,124.5.4查看磁带上备份内容:134.5.5从磁带库中取出已使用磁带放到异地保留:134.5.6将取出磁带重新放入磁带库中:134.5.7向磁带库中增加新供TSM使用磁带:134.5.8将新磁带添加到storage pool 中(可选)13
4、4.5.9反复利用磁带库中磁带134.6管理磁带库存放池144.7管理用户端节点144.7.1删除一个用户端节点144.7.2修改节点密码144.8定时备份维护144.8.1TSM Clien/TDP节点定时备份守候进程144.8.2用户端停止定时备份144.8.3查看定时备份日志154.9建立策略域(Policy Domain)154.10监控TSM Server运行情况155IBM用户支持服务步骤16 1 序言本文档是TSM巡检操作手册,常见问题处理和日常维护。2 TSM巡检操作手册2.1 查看TSM服务器 查看TSM服务器和ADIC带库连接状态,以下图为正常:关键为其它设备能够看到ADI
5、CSNC,介质变换器,磁带驱动器全部有设备显示。2.2 查看TSM manage console在开始菜单-程序-Tivoli Storage Manager中选择运行Management Console:能够看到带库和驱动器信息。2.3 在TSM服务器上登录到管理界面在cmd窗口里进入到TSM安装目录baclient下运行dsmadmc,输入口令/密码admin/admin进入管理员界面2.4 在TSM client端检验检验lanfree进程,使用命令:#ps ef|grep dsmsta假如进程没有开启,需要开启这个进程,方法:IBM服务器路径/usr/tivoli/tsm/Storag
6、eAgent/bin#nohup ./dsmsta &HP 服务器路径/opt/tivoli/tsm/StorageAgent/bin#nohup ./dsmsta &3 TSM常见问题处理在处理问题过程中,需要具体问题具体分析,首先需要检验多种错误日志,定位问题,然后参考以下处理问题措施,同时也可直接联络800技术支持热线,寻求专业技术支持。3.1 TSM Server故障处理3.1.1 全部备份和恢复操作全部无法进行问题描述TSM Server开启正常,但全部备份和恢复操作全部无法进行。问题处理提议检验TSM本身数据库是否已满? query database 3.1.2 怎样取得TSM错误
7、描述问题描述在TSM日志中发觉有类似ANR7800I 错误信息,怎样得到该错误号具体描述。问题处理提议使用TSM文档查找错误描述,或直接使用命令查找: help 78003.1.3 系统出现无法读写磁带或磁盘故障问题描述在日常备份过程中或TSM日志中出现无法读写磁带或磁盘故障。问题处理提议检验磁带库是否正常?TSMq library;查看是否Online状态;检验驱动器是否正常?TSMq drive;查看是否Online状态;检验磁带是否正常?TSM q libvolume;查看磁带状态;看是否是读写状态。TSM q vol f=d ;查看磁带状态;看是否是读写状态。检验Path 是否正常?T
8、SM q path;看online是否为yes ?检验具体TSM活动日志TSM QUERY ACTLOG BEGINTIME=NOW-30 ENDTIME=NOW检验操作系统下相关设备日志。在操作系统下检验设备状态; AIX : lsdev Cc tape3.1.4 处理带库故障后TSM工作不正常。问题描述当带库出现故障后,如更换driver后,TSM工作不正常。问题处理提议根据配置步骤重新检验path,drive 定义、状态检验磁带机s/n 号。3.1.5 a tape in library does not display in q libv问题描述a tape in library do
9、es not display in q libv。问题处理提议checkin libv libname search=yes checkl=b status=scr3.1.6 reclaim process not run问题描述reclaim process not run, check stgpool reclaim threashold, the value was 100问题处理提议modify threashold less than 1003.1.7 how to delete archive log files after backup问题描述how to delete arch
10、ive log files after backup问题处理提议using rman delete input all option3.1.8 windows device manager, found a drive mark as yellow问题描述In windows device manager , found a drive mark as yellow , so many operations is not successful .问题处理提议重起TSM 服务器?重新安装 library driver ?重起 Tape Library ?3.2 TSM Client故障处理3.2
11、.1 TSM Client无法连接TSM Server问题描述TSM Client 无法连接TSM Server。问题处理提议检验服务器配置文件,并检验服务器是否绑定配置文件中要求端口?查看服务器状态(Query Status)确保设置好了Availability: Enabled;检验用户端配置文件中端口号和IP地址是否和服务器端一致;检验节点是否被服务器端锁定(LOCK);系统管理员检验网络情况和服务器内存利用情况,假如内存不够用了,则新连接肯定无法建立。3.2.2 TSM Client备份大文件时常常不成功问题描述TSM Client在备份大文件时常常报以下错误,但备份小文件没有问题:-
12、03-13 11:50:37 ANS1005E 在套接字 = 636处 TCP/IP 读取错误, 错误号 = 10035, 原因:无法立即完成一个非阻挡性套接字操作。-03-13 11:50:37 ANS1809W 会话丢失;正在初始化会话再打开过程。-03-13 11:50:53 ANS1811S TSM 会话无法重建。问题处理提议检验服务器端dsmserv.opt中有一项IDLETimeout、Commtimeout设置,调大后进行测试。( 注:要求TSM Server和 storage agent端设置一致)。3.2.3 ANS1312E error in dsmerror.log问题描
13、述ANS1312E error in dsmerror.log问题处理提议delete old path re-define3.2.4 when backup data, error: media can not mount问题描述when backup data, error: media can not mount问题处理提议re-define drive path, audit library3.2.5 ANR8779E Unable to open drive mt0.3.0.3, error number=170问题描述On Windows ,actlog , ANR8779E Un
14、able to open drive mt0.3.0.3, error number=170.问题处理提议检验 library 状态。检验 path ,发觉path offline,无法online。在操作系统下删除设备,重新识别?重新定义path 。4 日常维护4.1 开启和停止TSM服务器开启TSM服务器系统中,TSM Server作为一项系统服务已设置为在系统开启时自动开启。停止TSM服务器停止TSM服务器操作步骤为:1.运行dsmadmc,输入口令/密码admin/admin进入管理员界面2.严禁服务器接收新用户端访问TSMdisable sessions3.查看目前用户端和服务器连接
15、TSMquery session4.等候用户端结束备份或直接中止连接TSMcancel session XX(all)5.查看服务器进程TSMquery process6.等候服务器进程结束或直接中止进程TSMcancel processq mount检验是否有磁带被使用。q request检验是否有需要人工干预操作。7.停止服务器TSMhalt4.2 进入管理员界面字符界面访问在TSM服务器上运行dsmadmc,输入管理员ID,密码。4.3 进入TSM client文件备份/恢复界面字符界面访问在TSM用户端运行 dsmc输入密码。GUI界面访问在TSM用户端运行dsmj,点击backup/
16、restore 按钮既可。要求有图形支持。4.4 管理数据库和日志查看tsm数据库和日志使用率查看数据库使用率,使用命令为TSMquery db,查看PctUtil项是否靠近100。查看日志使用率,使用命令为TSMquery log,查看PclUtil项是否靠近100。扩充数据库和日志容量如PctUtil靠近100,则必需扩充容量,扩数据库为:TSMdefine dbvolume dsmdb02.dsm formatsize=XX wait=yes TSMextend db XX 扩日志容量为:TSMdefine logvolume log03 formatsize=XX wait=yesTS
17、Mextend log XX(XX为大小,比如200代表200MB.)扩充以后,用query db和q log查看扩充后PctUtil值。4.5 管理磁带库因为TSM对磁带库以独占方法访问,所以,在TSM Server运行时候,不要用任何其它命令或方法对磁带库进行操作,以免冲突。4.5.1 查看带库中磁带驱动器状态:在磁带驱动器状态正常情况下,TSM才能正常备份数据。TSMquery drive 查看磁带驱动器状态,其中OnLine列应皆为Yes,表明磁带驱动器能够使用。若TSM开启后观察到OnLine项不为Yes,检验磁带库是否已上电,或请求IBM 支持。4.5.2 磁带分配:磁带分配是自动
18、,系统中有2个存放池,某个池需要磁带时,系统就会从目前空闲磁带目录中分配磁带给它。1盘供TSM备份本身数据库。因为已在设定存放池(stgpool)时指定MaxScratch,所以其它带子能够需要时自动加入。向磁带库中增加新供TSM使用磁带1.在磁带库I/O槽中放入新磁带。2.label libvolume LIBRARY(这里是使用q library查看到磁带库名称) A000XXX(这里是使用q libvol查看到磁带名称) overwrite=yes checkin=scratch参考label libvolume 3584lib search=yes labelsource=bar ch
19、eckin=scratch overwrite=yes3.tsm: TSM q actlog4.tsm: TSM TSM reply 25.将磁带从带库中取出TSM checkout libv libname a000474.5.3 检验活动日志,有可能要求作出回应,TSM q request TSM reply 1 label=a000474.5.4 查看磁带上备份内容:在TSM字符管理界面下运行:TSMq content TAPE_LABEL其中TAPE_LABEL为备份使用磁带标签,可用q vol 或 q libvolume看到。所看到文件名格式为_XXmmddhhmm_x,其中中间一串
20、时间对应上述。所以也能够经过这里知道要恢复备份时间戳。4.5.5 从磁带库中取出已使用磁带放到异地保留:TSMcheckout libvolume LIBRARY(这里是使用q library查看到磁带库名称) TAPE_LABEL remove=yes然后从磁带库前面I/O窗口中取出退出磁带妥善保留。这时用q vol命令能够看到这盘磁带信息,但用q libvolume看不到。4.5.6 将取出磁带重新放入磁带库中:将欲放回磁带放入前面I/O窗口中,注意条码一边向内。TSMcheckin libvolume LIBRARY(这里是使用q library查看到磁带库名称) search=bulk
21、 status=private 4.5.7 向磁带库中增加新供TSM使用磁带: 将欲放回磁带放入磁带库前面I/O窗口中,注意条码一边向内。 TSMlabel libvolume LIBRARY(这里是使用q library查看到磁带库名称) search=bulk labelsource=barcode checkin=scratch4.5.8 将新磁带添加到storage pool 中(可选)TSMdefine volume POOL_NAME TAPE_LABEL4.5.9 反复利用磁带库中磁带1.自动反复利用当以前备份随时间流逝而过期,磁带上对应空间会腾空,但因为磁带属于流设备,只要后面
22、还有数据存在,前面空闲空间就不可使用。缺省状态下,当一盘磁带上这么可回收空间达成90%时,TSM会自动将这盘磁带上全部数据转移到同一存放池另一盘有足够可用空间磁带上,使这盘磁带能够被反复利用。这种方法不需要人工干预。2.快速反复利用假如用 q content命令查看某盘磁带上备份内容后,认为这些备份数据全部能够删除了,我们就能快速清空这盘磁带,使它能够被反复利用。TSMdelete vol TAPE_LABEL discarddata=yesTSMdefine volume POOL_NAME TAPE_LABEL4.6 管理磁带库存放池查看数据存放池利用率:比如vobpool:TSMquer
23、y stgpool vobpool format=detailPctUtil值表示其利用率。4.7 管理用户端节点4.7.1 删除一个用户端节点删除一个用户端节点,只需在服务器上将节点删除,但必需要有足够权限。1.除该节点在服务器端数据,使用命令:TSMdelete filespace NODENAME * wait=yes2. 节点定义,使用命令TSMremove node Nodename4.7.2 修改节点密码使用命令:TSM update node Nodename NewPasswd4.8 定时备份维护4.8.1 TSM Clien/TDP节点定时备份守候进程1. 后台开启定时器:#
24、 cd /usr/tivoli/tsm/client/ba/bin# nohup dsmc schedule -se=* -password=* 2/dev/null&2.以在/etc/inittab中加入以下行使其自动开启。Tsm:once:/usr/bin/dsmc schedule -se=* -password=* /dev/null 2&1 # TSM Scheduler4.8.2 用户端停止定时备份(1)ps -ef|grep dsmc|grep schedule得到全部dsmc schedule进程号。(2)kill -9将其中止。4.8.3 查看定时备份日志dsmsched.l
25、og,该文件存在运行dsmc schedule命令目录。4.9 建立策略域(Policy Domain)策略域定义备份保留版本及版本保留时间,是TSM存放管理关键。1. NDARD策略域COPY为一个新策略域。3.修改Backup Copy Group属性,指定Storage Pool、对象存在时保留版本数(Verexist)、对象删除后保留版本数(Verdeleted)、额外版保留天数(Retextra)、最终版本保留天数(Retonly)。4.检验,激活上述配置。4.10 监控TSM Server运行情况 使用query status命令查看server目前状态。 使用query actl
26、og命令查看近期内服务器和用户端活动。能够设定具体查看时间段。 使用query volhist type=dbbackup查看TSM服务器数据库备份情况。 使用query event命令查看用户定时器状态,成功、失败或未来状态。 使用query event type=admin命令查看TSM服务器定时器状态,成功、失败或未来状态。 查看/usr/Tivoli/tsm/server/bin/dsmerror.log和dsierror.log中犯错信息。 查看用户端/usr/Tivoli/tsm/client/ba/bin/dsmsched.log中定时备份信息。 能够使用dsmadmc -con
27、solemode命令开一个窗口,窗口中会统计服务器和用户端活动情况。 使用query content A00047(这里是使用q vol查看到磁带卷名称)查看磁带中备份内容。5 IBM用户支持服务步骤IBM电话支持步骤提供5x8小时及7x二十四小时(仅限严重程度一问题)远程电话支持。工作时间内(每七天一至五,早晨8:30到下午17:00), 对于用户汇报技术问题,工程师将在收到用户电话后两小时内给予响应。非工作时间内,对用户汇报严重程度一技术问题,工程师将在收到用户电话后两小时内给予响应。IBM软件产品售后问题申请和处理步骤关键包含三个阶段:用户技术支持步骤图第一阶段: 向用户问题协调员提供一
28、下信息:您基础信息,包含姓名、企业名称和联络电话贵企业用户号用户号:IBM用户问题协调员将对您信息进行登记,并转接给对应IBM软件技术支持工程师。第二阶段: 向IBM软件技术支持工程师提供:产品相关信息,包含产品版本号、补丁等级、操作系统及版本号、产品相关配置信息;其它相关信息,如网络配置信息,数据库信息和应用系统信息等;错误描述,如发生频率、引发错误相关操作、重现错误步骤、错误现象、错误日志信息等。我们工程师将帮助您分析问题原因,采取对应处理方法。第三阶段: 当您技术问题需要更多资源协同处理时,该问题申请将自动进入本阶段。由IBM首层技术工程师协调IBM全球技术资源,并向用户提交最终处理方案
29、。6 常见TSM命令q vol :查询存放池中卷q node :查询结点q library:查询带库q drive:查询驱动器q libvol:查询带库中卷q stgpool:查询存放池q devclass:查询设备类q sess :查询会话q mount:查询驱动器加载磁带情况q con xxx:查询xxx卷中内容q act:查看活动日志q status:查看服务器信息q process:查看活动进程f=dreg node nodename password:注册结点define library .:定义带库define drive:定义驱动器define path:定义路径define stgpool:定义存放池define devclass:定义设备类label vol:标号磁带check in:检入磁带check out:检出磁带help xxx:获取对应命令使用帮助