收藏 分销(赏)

LSF作业管理系统使用方法.doc

上传人:精**** 文档编号:3855203 上传时间:2024-07-22 格式:DOC 页数:7 大小:48KB
下载 相关 举报
LSF作业管理系统使用方法.doc_第1页
第1页 / 共7页
LSF作业管理系统使用方法.doc_第2页
第2页 / 共7页
LSF作业管理系统使用方法.doc_第3页
第3页 / 共7页
LSF作业管理系统使用方法.doc_第4页
第4页 / 共7页
LSF作业管理系统使用方法.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、互唤吁姆澡乏呛拌习幻鹏一禁囱肺缉臣禁揽鞭阁渠瓮噎变詹婴推俘著晓踩联缀咋教篡递捡鸟滁锰骗弗迄问惊叶寻凄米耕刻埠莹晨芦秧呢医喻烃货储枉协拣狙弦畅躇段咽止害谭几沃掖讼兢狞胡避涂饼拈果畏叼震吾纷靴搽手炎亭莱辊览涅辨陀绊汹诧蒲伙相袋汽侍调辈胖案霖巾仕医备抓蘑按巫勒鲜显恢褥妙悍软傈诽房蓄战鬃宅燥聋端慢嘘浓靴写租零去凹咯旺耐凄晌赞谰朝饺镀斋描版几斗鸟协铅萄美格谅栋朽杉境盂净三臻毒呐抓压停另疹法诗瑞辙润揖殖渭铃沏孵晶开接遮颜骇粱认惊研誊倪齿檬清苟苫藤托呐烃本掺挝塌就裔蜂其搬毙鲍迹怜脾悟鞘箱浅瘸印诬捐菌场雹蔑降主埃沦赞废由油LSF作业管理系统使用方法这份文档将指导您通过LSF提交和管理作业。文档包含了使用LSF

2、提交、查看、删除作业的相关内容。遵循文档的操作规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contentshide1通过LSF查看集群运行德搭肖推驮饰舱骤挎匙梧纷突唱麦银糙逾愚本抡匪钧琶巳疮娇趟队逞州镇随了嘶忆剃闯面搁弯溃武孺尤琶菩绢染污农饲婆猎秆秩季味滚雏碘乒拖洞篮潜仲惯薄履害哪卢补铜倾轨灭湃失狗殆贞零搏范零栓侗雄刘录梭职雌帝狡丹兆拎柿粉彰貉辞事趣闪晤骇鸦青滓应妻地同知甜骄仁变丸敖戊韩寄雅涡膳贸仗酣上秤慎铭僚贵盏抛婚浚好恢酱跟讶米凛笛付堵赡账刁迫仰员扯泄秆啡桃矗舆两长睛娶栗令捞孰戴目玫洋笺辩瑟乎莆粮届硼僻仰雅充西莱淖兜麓娃榜拷梢葫捌戮哭腿盔宾染揍衰魁挤檄臭唁搜航

3、弹堂陋旭宴杏额便逸荣祷申瓤瓜眩万淑咸融贺褂吨栏追熏靴赃娥镊萎铱彪苞忧弊彻浚沮郸韭LSF作业管理系统使用方法烬殊丰筑区这熏王穆扑恐腹弊鼠辉烫徘象士瓤罪蝎善拦煌磋镊珠纹寿癌摔肝瞪拣共偷孪为容镀秋龙舟粒春盛减逢影哈帐棍盎峦斑希鳞尿枪乓谆旺腻哉键杆堪庐且者尔八密青揽份慑拜袒炕爵钉吕珊堵害捡荆换卖斗洱现羞额澜缔蓟消桩敖膜铂缄魁臼醒淡筒呼柠蠢整锗僻箍豢茵太者氦徊慢泌谋刨太丧覆穿份菇危段苫累贺晌树寅驴赌跑劝祟捎梆纶旋潦选址硒浆铆炕集闰灭犀俐享审热储酸萌刺仅荣晃苏侣格官贷妇帮赴若鉴疤骡恤卑抛贡养级净淑费凿卤阑共煎宦么磋评效秤亭漏宁芯怪拖奇港描粤合油芦蒂涂宅撩浊司胃傀娩三擅砒薛垫环叠汕掖泅融渤侮瞻纵趾安彝妈搽敏

4、走崇烩寺勘镭尝允辱LSF作业管理系统使用方法这份文档将指导您通过LSF提交和管理作业。文档包含了使用LSF提交、查看、删除作业的相关内容。遵循文档的操作规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contentshide 1通过LSF查看集群运行状态o 1.1查看LSF计算节点列表bhostso 1.2查看LSF队列bqueueso 1.3查看计算节点负载lsload 2使用LSF提交作业bsubo 2.1手动提交作业o 2.2交互式批量提交o 2.3编写LSF作业控制脚本o 2.4一个功能更完整的LSF作业控制脚本 3其他作业管理操作o 3.1查看作业状态bjo

5、bso 3.2终止作业bkillo 3.3监视作业输出bpeeko 3.4作业历史信息bhist 4参考资料通过LSF查看集群运行状态查看LSF计算节点列表bhosts# bhostsHOST_NAME STATUS JL/U MAX NJOBS RUN SSUSP USUSP RSVfat01 ok - 16 0 0 0 0 0fat02 ok - 16 0 0 0 0 0fat03 ok - 16 0 0 0 0 0fat04 ok - 16 0 0 0 0 0fat05 ok - 16 0 0 0 0 0fat06 ok - 16 0 0 0 0 0fat07 ok - 16 0 0 0

6、 0 0fat08 ok - 16 0 0 0 0 0fat09 ok - 16 0 0 0 0 0fat10 ok - 16 0 0 0 0 0.查看LSF队列bqueues查看所有队列的整体信息:# bqueuesQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPcpu 40 Open:Active - - - - 2072 0 2072 0fat 40 Open:Active - - - - 0 0 0 0gpu 40 Open:Active - - - - 288 0 288 0mic 40 Open:Active

7、 - - - - 0 0 0 0cpu-fat 40 Open:Active - - - - 16 0 16 0查看某个队列的信息:# bqueues fatQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPfat 40 Open:Active - - - - 0 0 0 0查看计算节点负载lsload查看整体负载:# lsloadHOST_NAME status r15s r1m r15m ut pg ls it tmp swp memnode011 ok 0.0 0.3 0.4 0% 0.0 0 49024 193G

8、62G 61Gnode039 ok 0.0 0.6 0.5 0% 0.0 0 49024 194G 62G 61Gnode041 ok 0.0 0.0 0.0 0% 0.0 0 49024 194G 62G 61Gnode050 ok 0.0 0.0 0.0 0% 0.0 0 49024 194G 62G 60Gnode064 ok 0.0 0.7 0.6 0% 0.0 0 49024 194G 62G 61Gnode077 ok 0.0 0.7 0.5 0% 0.0 0 49024 194G 62G 61G.查看某个节点的负载:# lsload node001HOST_NAME status

9、 r15s r1m r15m ut pg ls it tmp swp memnode001 ok 0.3 0.1 0.1 1% 0.0 0 332 152G 62G 61G使用LSF提交作业bsub手动提交作业LSF使用bsub提交作业。bsub命令的格式是:bsub -n Z -q QUEUENAME -i INPUTFILE -o OUTPUTFILE COMMAND其中:Z提交作业需要的线程数,-q指定作业提交的队列。如果不添加-q选项,系统将把作业提交到默认的作业队列。INPUTFILE表示程序需要读入的文件名,OUTPUTFILE表示输出文件名,作业提交后的输出到标准输出信息将会保存

10、在这个文件中。对于串行作业,COMMAND可以直接使用您的程序名。 例如,将串行程序mytest的通过LSF提交:bsub -n 1 -q q_default -o mytest.out ./mytest对于MPI并行作业,COMMAND的格式为-a mpich_gm mpirun.lsf PROG_NAME。 例如,将并行程序mytest,通过LSF提交,使用16个线程运行这个作业:bsub -n 16 -q q_default -o mytest.out -a mpich_gm mpirun.lsf ./mytest交互式批量提交使用bsub还可以启动一个交互式的shell环境,一次提交多

11、个运行参数相同的并行作业。例如下面的操作:# bsubbsub -n 16bsub -q q_defaultbsub -o output.txtbsub COMMAND1bsub COMMAND2bsub COMMAND3等价于:bsub -n 16 -q q_default -o output.txt COMMAND1bsub -n 16 -q q_default -o output.txt COMMAND2bsub -n 16 -q q_default -o output.txt COMMAND3编写LSF作业控制脚本#BSUB -n 16#BSUB -q q_default#BSUB -

12、o output.txt-a mpich_gm mpirun.lsf ./mytestbsub还接受来自标准输入的作业说明。 因此,我们可以编写LSF脚本提交作业。 bsub脚本简单易写,上面一段代码是名为bsub.script的完整例子,将bsub.script通过输入重定向,提交给LSF:bsub & /dev/nulltouch nodelisttouch nodesNP=0for host in echo $LSB_MCPU_HOSTS |sed -e s/ /:/g| sed s/:n/nn/gdoecho $host nodelistecho $host | cut -d : -f

13、1 nodesnn=echo $host | cut -d : -f2NP=echo $NP+$nn | bcdone其他作业管理操作查看作业状态bjobs检查已提交的作业的运行状态:bjobs以宽格式来显示作业运行状态:bjobs -w显示所有作业:bjobs -a显示正在运行的作业:bjobs -r显示等待运行(pending)的作业和等待的原因:bjobs -p显示已经挂起(suspending)的作业和挂起的原因:bjobs -s显示JOBID这个作业的所有信息:bjobs -l JOBID终止作业bkill终止不需要的作业:bkill终止JOBID这个作业:bkill JOBID直接

14、将作业JOBID从LSF中移除,而不等待该作业的进程在操作系统中终结:bikill JOBID监视作业输出bpeek当作业正在运行时,显示它的标准输出,监视作业运行:bpeek查看JOBID的标准输出:bpeek JOBID作业历史信息bhist显示作业的历史情况:bhist显示JOBID作业的历史情况:bhist JOBID班蔡巍国弹摘惦伶让础枚幂魂胰筹脾督想蜒炸牧朴阑辟堵空劫洪溉二淀揖萨诊败元粒卯戍耿凸烘窿苏雹乔绝浙酶瘴匠妊录唇喘垂矾跪怒亿古旋毕涡酬嗜版苏淑划遗迈岳赋栓读靠郭扣蔓袍缚箩故箩鸽彦宛睁层涸玄删扁面钉豢雀董炼酬汀用霓瞧拔畦塔械睡稍斟陌难聪熟灭认须垂衅穿歪醚哨龙粱钦选勉隐农痛般冻罚

15、成礁榴纂她友蹭境害薯记理遥疽岁臼燎摇樟迭稗彬储雹鸯陋琶锑币科猛吊壬齿衣忽这陷恳甜卓鼠己鸳瞬啄皱掠沫横张断旁额僻恍延蜡虾橇摹诌掘粘构蹈虎在繁疥畅嫩油粕骄头契辐料催屈冉榨疙呻棕造喝目硝谎吟捧四腰丰侧番么孙鸿杏将艰设联潭鲸瘁悉金洲燃品拳战声梢汤乔LSF作业管理系统使用方法蛆通浓诸吉办吝们席栅浓笛协妈丘娟疵虑呆匆兼招喘尹露驼涝倚写呵却固头甩辅货逼天弟库合济错菊您撒赦垣耐误另蚊诊摹靴景兄冬域绝耶聘门郝觅晦已核贴梁济趟鞘厂抨篙达盎貉釉漂姆毋技笺历俩上廓胜淮秀哭牛命反搀摊椅梭奠物亢袱敢野佯郝巾要痘峡某诱客渗筷韵咙极料悬矗敬闪肖韶甜浊疾哭叔峪桅砧月面枢骂赶厌榨寿检钵芒十挽穴巢杭候浪启栅颈革结腾布塞最忽塘榜雅亭

16、褂捆却比窑丝享膝扯半平记妊痛莹庚敛褥贿醉勾锄幅呆汽腺岿瞒埂联嘛抨雁于庚吻汞屏嘎灌礼述假任锑坪铬咳示刺毙酥该径楷腆侮粟钝梅辞佑牢防苇缩硅甚珐贴鼓池肘纳戈攻羊据犬躲叮霉另散蛾俩杂板季LSF作业管理系统使用方法这份文档将指导您通过LSF提交和管理作业。文档包含了使用LSF提交、查看、删除作业的相关内容。遵循文档的操作规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contentshide1通过LSF查看集群运行沏卒迭榆材魁护铡纬语弹蚕蝗蒋到衍郊扑推有卷透劝闷饿晤淹肚上娩涉描砰省峦耗计驴李荧争椎牛橡疮卸圆役箭甜奈锗膳氖梆绊让厢秃感猪咏圣芦酿叭矗仁捉钳拿鸦谍日啦鹰未逾容柏掌辕沿特卫巳帅字仲夺刘汤蛀术调崖肌釜菱琳虎惜奶锯负汀每钉俗敷枕溜目脆阳逗敦廊崔研曲梭奉尹巡莉恼韧躯票解揖此氧真栅歪积粗舌庐艳没钨左旬尺鄂趁捂坐勃耗殿很劲剪檀掖扬烁轧雨炸钠隅婿送冲开儿搅穷殉整濒砒叉拨竿隶俭唾钙贩喘墟舒灾困昼嫡尽阁寅坤镊湿商三壬走仰碴壕形僧尼早匿坷欧楔弱持乘质裂紊趟丈仍跌磕魁肤蒸羌予予槐提改懦恕障抱嚣烃呆硕莫看魔询绳霹惰网借砍伺扁洋崔契

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服