收藏 分销(赏)

TSM日常维护手册.doc

上传人:天**** 文档编号:2022792 上传时间:2024-05-13 格式:DOC 页数:19 大小:306KB
下载 相关 举报
TSM日常维护手册.doc_第1页
第1页 / 共19页
TSM日常维护手册.doc_第2页
第2页 / 共19页
TSM日常维护手册.doc_第3页
第3页 / 共19页
TSM日常维护手册.doc_第4页
第4页 / 共19页
TSM日常维护手册.doc_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、xx TSM数据备份项目日常维护手册xxxxxx科技有限公司目录1前言32TSM巡检操作手册42.1查看TSM服务器42.2查看TSM manage console42.3在TSM服务器上登录到管理界面52.4在TSM client端检查63TSM常见问题的处理63.1TSM Server的故障处理63.1.1所有的备份和恢复操作都无法进行63.1.2如何获得TSM错误描述73.1.3系统出现无法读写磁带或磁盘的故障73.1.4处理带库故障后TSM工作不正常。83.1.5a tape in library does not display in q libv83.1.6reclaim proc

2、ess not run83.1.7how to delete archive log files after backup83.1.8windows device manager, found a drive mark as yellow93.2TSM Client的故障处理93.2.1TSM Client无法连接TSM Server93.2.2TSM Client备份大文件时经常不成功93.2.3ANS1312E error in dsmerror.log103.2.4when backup data, error: media can not mount103.2.5ANR8779E Un

3、able to open drive mt0.3.0.3, error number=170104日常维护104.1启动和停止TSM服务器104.2进入管理员界面114.3进入TSM client文件备份/恢复界面114.4管理数据库和日志114.5管理磁带库124.5.1查看带库中磁带驱动器状态:124.5.2磁带的分配:124.5.3检查活动日志,有可能要求作出回应,124.5.4查看磁带上的备份内容:134.5.5从磁带库中取出已使用的磁带放到异地保存:134.5.6将取出的磁带重新放入磁带库中:134.5.7向磁带库中增加新的供TSM使用的磁带:134.5.8将新磁带添加到storag

4、e pool 中(可选)134.5.9重复利用磁带库中的磁带134.6管理磁带库存储池144.7管理客户端节点144.7.1删除一个客户端节点144.7.2修改节点密码144.8定时备份维护144.8.1TSM Clien/TDP节点定时备份守候进程144.8.2客户端停止定时备份144.8.3查看定时备份日志154.9建立策略域(Policy Domain)154.10监控TSM Server运行情况155IBM客户支持服务流程16 1 前言本文档是TSM巡检操作手册,常见问题的处理和日常维护。2 TSM巡检操作手册2.1 查看TSM服务器 查看TSM服务器和ADIC带库的连接状态,如下图为

5、正常:主要为其它设备可以看到ADIC的SNC,介质变换器,磁带驱动器都有设备显示。2.2 查看TSM manage console在开始菜单-程序-Tivoli Storage Manager中选择运行Management Console:可以看到带库和驱动器的信息。2.3 在TSM服务器上登录到管理界面在cmd的窗口里进入到TSM的安装目录baclient下运行dsmadmc,输入口令/密码admin/admin进入管理员界面2.4 在TSM client端检查检查lanfree的进程,使用命令:#ps ef|grep dsmsta如果进程没有启动,需要启动这个进程,方法:IBM服务器的路径

6、/usr/tivoli/tsm/StorageAgent/bin#nohup ./dsmsta &HP 服务器的路径/opt/tivoli/tsm/StorageAgent/bin#nohup ./dsmsta &3 TSM常见问题的处理在解决问题的过程中,需要具体问题具体分析,首先需要检查各种错误日志,定位问题,然后参考以下解决问题的办法,同时也可直接联系800技术支持热线,寻求专业的技术支持。3.1 TSM Server的故障处理3.1.1 所有的备份和恢复操作都无法进行问题描述TSM Server启动正常,但所有的备份和恢复操作都无法进行。问题处理建议检查TSM本身的数据库是否已满? q

7、uery database 3.1.2 如何获得TSM错误描述问题描述在TSM的日志中发现有类似ANR7800I 的错误信息,如何得到该错误号的详细描述。问题处理建议使用TSM的文档查找错误描述,或直接使用命令查找: help 78003.1.3 系统出现无法读写磁带或磁盘的故障问题描述在日常备份过程中或TSM日志中出现无法读写磁带或磁盘的故障。问题处理建议检查磁带库是否正常?TSMq library;查看是否Online状态;检查驱动器是否正常?TSMq drive;查看是否Online状态;检查磁带是否正常?TSM q libvolume;查看磁带状态;看是否是读写状态。TSM q vol

8、 f=d ;查看磁带状态;看是否是读写状态。检查Path 是否正常?TSM q path;看online是否为yes ?检查详细的TSM活动日志TSM QUERY ACTLOG BEGINTIME=NOW-30 ENDTIME=NOW检查操作系统下关于设备的日志。在操作系统下检查设备状态; AIX : lsdev Cc tape3.1.4 处理带库故障后TSM工作不正常。问题描述当带库出现故障后,如更换driver后,TSM工作不正常。问题处理建议按照配置步骤重新检查path,drive 的定义、状态检查磁带机的s/n 号。3.1.5 a tape in library does not di

9、splay in q libv问题描述a tape in library does not display in q libv。问题处理建议checkin libv libname search=yes checkl=b status=scr3.1.6 reclaim process not run问题描述reclaim process not run, check stgpool reclaim threashold, the value was 100问题处理建议modify threashold less than 1003.1.7 how to delete archive log f

10、iles after backup问题描述how to delete archive log files after backup问题处理建议using rman delete input all option3.1.8 windows device manager, found a drive mark as yellow问题描述In windows device manager , found a drive mark as yellow , so many operations is not successful .问题处理建议重起TSM 服务器?重新安装 library driver

11、?重起 Tape Library ?3.2 TSM Client的故障处理3.2.1 TSM Client无法连接TSM Server问题描述TSM Client 无法连接TSM Server。问题处理建议检查服务器配置文件,并检查服务器是否绑定配置文件中规定的端口?查看服务器的状态(Query Status)确保设置好了Availability: Enabled;检查客户端配置文件中端口号和IP地址是否与服务器端一致;检查节点是否被服务器端锁定(LOCK);系统管理员检查网络状况和服务器的内存利用状况,如果内存不够用了,则新的连接肯定无法建立。3.2.2 TSM Client备份大文件时经常

12、不成功问题描述TSM Client在备份大文件时经常报如下错误,但备份小文件没有问题:2006-03-13 11:50:37 ANS1005E 在套接字 = 636处 TCP/IP 读取错误, 错误号 = 10035, 原因:无法立即完成一个非阻挡性套接字操作。2006-03-13 11:50:37 ANS1809W 会话丢失;正在初始化会话的再打开过程。2006-03-13 11:50:53 ANS1811S TSM 会话无法重建。问题处理建议检查服务器端dsmserv.opt中有一项IDLETimeout、Commtimeout设置,调大后进行测试。( 注:要求TSM Server和 st

13、orage agent端设置一致)。3.2.3 ANS1312E error in dsmerror.log问题描述ANS1312E error in dsmerror.log问题处理建议delete old path re-define3.2.4 when backup data, error: media can not mount问题描述when backup data, error: media can not mount问题处理建议re-define drive path, audit library3.2.5 ANR8779E Unable to open drive mt0.3.

14、0.3, error number=170问题描述On Windows ,actlog , ANR8779E Unable to open drive mt0.3.0.3, error number=170.问题处理建议检查 library 状态。检查 path ,发现path offline,无法online。在操作系统下删除设备,重新识别?重新定义path 。4 日常维护4.1 启动和停止TSM服务器启动TSM服务器系统中,TSM Server作为一项系统服务已设置为在系统启动时自动启动。停止TSM服务器停止TSM服务器操作步骤为:1.运行dsmadmc,输入口令/密码admin/admi

15、n进入管理员界面2.禁止服务器接收新的客户端访问TSMdisable sessions3.查看当前客户端与服务器的连接TSMquery session4.等待客户端结束备份或直接中断连接TSMcancel session XX(all)5.查看服务器进程TSMquery process6.等待服务器进程结束或直接中断进程TSMcancel processq mount检查是否有磁带被使用。q request检查是否有需要人工干预的操作。7.停止服务器TSMhalt4.2 进入管理员界面字符界面访问在TSM服务器上运行dsmadmc,输入管理员ID,密码。4.3 进入TSM client文件备份

16、/恢复界面字符界面访问在TSM客户端运行 dsmc输入密码。GUI界面访问在TSM客户端运行dsmj,点击backup/restore 按钮既可。要求有图形支持。4.4 管理数据库和日志查看tsm数据库和日志使用率查看数据库使用率,使用命令为TSMquery db,查看PctUtil项是否接近100。查看日志使用率,使用命令为TSMquery log,查看PclUtil项是否接近100。扩充数据库和日志容量如PctUtil接近100,则必须扩充容量,扩数据库为:TSMdefine dbvolume dsmdb02.dsm formatsize=XX wait=yes TSMextend db

17、XX 扩日志容量为:TSMdefine logvolume log03 formatsize=XX wait=yesTSMextend log XX(XX为大小,例如200代表200MB.)扩充之后,用query db和q log查看扩充后PctUtil的值。4.5 管理磁带库由于TSM对磁带库以独占方式访问,所以,在TSM Server运行的时候,不要用任何其他命令或方式对磁带库进行操作,以免冲突。4.5.1 查看带库中磁带驱动器状态:在磁带驱动器状态正常情况下,TSM才能正常的备份数据。TSMquery drive 查看磁带驱动器状态,其中OnLine列应皆为Yes,表明磁带驱动器可以使用

18、。若TSM启动后观察到OnLine项不为Yes,检查磁带库是否已上电,或者请求IBM 支持。4.5.2 磁带的分配:磁带的分配是自动的,系统中有2个存储池,某个池需要磁带时,系统就会从当前的空闲磁带目录中分配磁带给它。1盘供TSM备份自身数据库。由于已在设定存储池(stgpool)时指定MaxScratch,所以其余带子可以需要时自动加入。向磁带库中增加新的供TSM使用的磁带1.在磁带库I/O槽中放入新磁带。2.label libvolume LIBRARY(这里是使用q library查看到的磁带库名称) A000XXX(这里是使用q libvol查看到的磁带的名称) overwrite=y

19、es checkin=scratch参考label libvolume 3584lib search=yes labelsource=bar checkin=scratch overwrite=yes3.tsm: TSM q actlog4.tsm: TSM TSM reply 25.将磁带从带库中取出TSM checkout libv libname a000474.5.3 检查活动日志,有可能要求作出回应,TSM q request TSM reply 1 label=a000474.5.4 查看磁带上的备份内容:在TSM字符管理界面下运行:TSMq content TAPE_LABEL其

20、中TAPE_LABEL为备份使用的磁带标签,可用q vol 或 q libvolume看到。所看到的文件名格式为_XXmmddhhmm_x,其中中间一串时间对应上述。所以也可以通过这里知道要恢复的备份的时间戳。4.5.5 从磁带库中取出已使用的磁带放到异地保存:TSMcheckout libvolume LIBRARY(这里是使用q library查看到的磁带库名称) TAPE_LABEL remove=yes然后从磁带库前面的I/O窗口中取出退出的磁带妥善保存。这时用q vol命令可以看到这盘磁带的信息,但用q libvolume看不到。4.5.6 将取出的磁带重新放入磁带库中:将欲放回的磁

21、带放入前面的I/O窗口中,注意条码一边向内。TSMcheckin libvolume LIBRARY(这里是使用q library查看到的磁带库名称) search=bulk status=private 4.5.7 向磁带库中增加新的供TSM使用的磁带: 将欲放回的磁带放入磁带库前面的I/O窗口中,注意条码一边向内。 TSMlabel libvolume LIBRARY(这里是使用q library查看到的磁带库名称) search=bulk labelsource=barcode checkin=scratch4.5.8 将新磁带添加到storage pool 中(可选)TSMdefine

22、 volume POOL_NAME TAPE_LABEL4.5.9 重复利用磁带库中的磁带1.自动重复利用当以前的备份随时间流逝而过期,磁带上相应的空间会腾空,但由于磁带属于流设备,只要后面还有数据存在,前面的空闲空间就不可使用。缺省状态下,当一盘磁带上这样的可回收空间达到90%时,TSM会自动将这盘磁带上的全部数据转移到同一存储池的另一盘有足够可用空间的磁带上,使这盘磁带可以被重复利用。这种方式不需要人工干预。2.快速重复利用如果用 q content命令查看某盘磁带上的备份内容后,认为这些备份数据都可以删除了,我们就能快速清空这盘磁带,使它可以被重复利用。TSMdelete vol TAP

23、E_LABEL discarddata=yesTSMdefine volume POOL_NAME TAPE_LABEL4.6 管理磁带库存储池查看数据存储池利用率:例如vobpool:TSMquery stgpool vobpool format=detailPctUtil的值表示其利用率。4.7 管理客户端节点4.7.1 删除一个客户端节点删除一个客户端节点,只需在服务器上将节点删除,但必须要有足够权限。1.除该节点在服务器端的数据,使用命令:TSMdelete filespace NODENAME * wait=yes2. 节点定义,使用命令TSMremove node Nodename

24、4.7.2 修改节点密码使用命令:TSM update node Nodename NewPasswd4.8 定时备份维护4.8.1 TSM Clien/TDP节点定时备份守候进程1. 后台启动定时器:# cd /usr/tivoli/tsm/client/ba/bin# nohup dsmc schedule -se=* -password=* 2/dev/null&2.以在/etc/inittab中加入如下行使其自动启动。Tsm:once:/usr/bin/dsmc schedule -se=* -password=* /dev/null 2&1 # TSM Scheduler4.8.2

25、客户端停止定时备份(1)ps -ef|grep dsmc|grep schedule得到所有dsmc schedule进程号。(2)kill -9将其中止。4.8.3 查看定时备份日志dsmsched.log,该文件存在运行dsmc schedule命令的目录。4.9 建立策略域(Policy Domain)策略域定义备份保存的版本及版本保存的时间,是TSM存储管理的核心。1. NDARD策略域COPY为一个新的策略域。3.修改Backup Copy Group属性,指定Storage Pool、对象存在时保留版本数(Verexist)、对象删除后保留版本数(Verdeleted)、额外版保留

26、天数(Retextra)、最后版本保留天数(Retonly)。4.检验,激活上述配置。4.10 监控TSM Server运行情况 使用query status命令查看server当前状态。 使用query actlog命令查看近期内服务器和客户端的活动。可以设定具体的查看时间段。 使用query volhist type=dbbackup查看TSM服务器数据库备份情况。 使用query event命令查看客户定时器状态,成功、失败或将来状态。 使用query event type=admin命令查看TSM服务器定时器状态,成功、失败或将来状态。 查看/usr/Tivoli/tsm/server

27、/bin/dsmerror.log和dsierror.log中的出错信息。 查看客户端的/usr/Tivoli/tsm/client/ba/bin/dsmsched.log中定时备份的信息。 可以使用dsmadmc -consolemode命令开一个窗口,窗口中会记录服务器和客户端的活动情况。 使用query content A00047(这里是使用q vol查看到磁带卷名称)查看磁带中的备份内容。5 IBM客户支持服务流程IBM电话支持流程提供5x8小时及7x24小时(仅限严重程度一的问题)远程电话支持。工作时间内(每周一至五,上午8:30到下午17:00), 对于客户报告的技术问题,工程师

28、将在收到客户电话后两小时内予以响应。非工作时间内,对客户报告的严重程度一的技术问题,工程师将在收到客户电话后两小时内予以响应。IBM软件产品售后问题申请与解决流程主要包括三个阶段:客户技术支持流程图第一阶段: 向客户问题协调员提供一下信息:您的基本信息,包括姓名、公司名称和联系电话贵公司客户号客户号:IBM客户问题协调员将对您的信息进行登记,并转接给相应的IBM软件技术支持工程师。第二阶段: 向IBM软件技术支持工程师提供:产品相关信息,包括产品版本号、补丁级别、操作系统及版本号、产品相关配置信息;其他相关信息,如网络配置信息,数据库信息和应用系统信息等;错误描述,如发生频率、引起错误的相关操

29、作、重现错误的步骤、错误现象、错误日志信息等。我们的工程师将协助您分析问题的原因,采取相应解决措施。第三阶段: 当您的技术问题需要更多资源协同解决时,该问题申请将自动进入本阶段。由IBM首层技术工程师协调IBM全球技术资源,并向客户提交最终解决方案。6 常用TSM命令q vol :查询存储池中的卷q node :查询结点q library:查询带库q drive:查询驱动器q libvol:查询带库中的卷q stgpool:查询存储池q devclass:查询设备类q sess :查询会话q mount:查询驱动器加载磁带情况q con xxx:查询xxx卷中的内容q act:查看活动日志q

30、status:查看服务器信息q process:查看活动进程f=dreg node nodename password:注册结点define library .:定义带库define drive:定义驱动器define path:定义路径define stgpool:定义存储池define devclass:定义设备类label vol:标号磁带check in:检入磁带check out:检出磁带help xxx:获取相应命令的使用帮助其中专业理论知识内容包括:保安理论知识、消防业务知识、职业道德、法律常识、保安礼仪、救护知识。作技能训练内容包括:岗位操作指引、勤务技能、消防技能、军事技能。

31、二培训的及要求培训目的安全生产目标责任书为了进一步落实安全生产责任制,做到“责、权、利”相结合,根据我公司2015年度安全生产目标的内容,现与财务部签订如下安全生产目标:一、目标值:1、全年人身死亡事故为零,重伤事故为零,轻伤人数为零。2、现金安全保管,不发生盗窃事故。3、每月足额提取安全生产费用,保障安全生产投入资金的到位。4、安全培训合格率为100%。二、本单位安全工作上必须做到以下内容: 1、对本单位的安全生产负直接领导责任,必须模范遵守公司的各项安全管理制度,不发布与公司安全管理制度相抵触的指令,严格履行本人的安全职责,确保安全责任制在本单位全面落实,并全力支持安全工作。 2、保证公司

32、各项安全管理制度和管理办法在本单位内全面实施,并自觉接受公司安全部门的监督和管理。 3、在确保安全的前提下组织生产,始终把安全工作放在首位,当“安全与交货期、质量”发生矛盾时,坚持安全第一的原则。 4、参加生产碰头会时,首先汇报本单位的安全生产情况和安全问题落实情况;在安排本单位生产任务时,必须安排安全工作内容,并写入记录。 5、在公司及政府的安全检查中杜绝各类违章现象。 6、组织本部门积极参加安全检查,做到有检查、有整改,记录全。 7、以身作则,不违章指挥、不违章操作。对发现的各类违章现象负有查禁的责任,同时要予以查处。 8、虚心接受员工提出的问题,杜绝不接受或盲目指挥;9、发生事故,应立即报告主管领导,按照“四不放过”的原则召开事故分析会,提出整改措施和对责任者的处理意见,并填写事故登记表,严禁隐瞒不报或降低对责任者的处罚标准。 10、必须按规定对单位员工进行培训和新员工上岗教育;11、严格执行公司安全生产十六项禁令,保证本单位所有人员不违章作业。 三、 安全奖惩: 1、对于全年实现安全目标的按照公司生产现场管理规定和工作说明书进行考核奖励;对于未实现安全目标的按照公司规定进行处罚。 2、每月接受主管领导指派人员对安全生产责任状的落

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服