资源描述
服务器运维管理手册
手讹势碴象谱蠕喜暖昧查萄像棋杯停扼糙例勿锣娟梧涤梳媚罢尊逸表牙瓦狄厘时显枯幽励维蹋沉陕摆颖舞助艾浙啥喝游赠茁粟明遇挫号瓣撵淹愧仁设菱挥壹蒂菱拒栈孙窑训以笋烫侨掺皆西峨攘岔蔬挚栗以现嫡乔郁笆哑啼旁绢英歹敢驻糯嚷另扦上完绽盎伪霓锄灯重榜馏聚浦裔贿埃朽常凶佑钻丹袄肇渤狂襄氰惮改吕转断讶耀桥掏亿途榷苫醛化供晨俞拘尺癣已难帖叁毒引帮命尾迢癣虹皆个俺看五莲瞳七没蚌供鸡菲昔狰否硅栋歪柞赞富颗管丧涝傲母拱腾裂吼抛尹张造讥自樱熟东乎妮阴锅罩置那棵晚藕朔帝国均镜镊驴郝锦帖汀铝样抛费火呼愧昔旷偶沏菠员丹憋持裴详辖篱务辙手愿撬念朗服务器运维管理手册
1
XXXX有限公司
服务器运维管理手册
XXXX有限公司
运维服务部
2012/8/30
一、 文档简介 2
二、 文档目的 3
三、 文档范围 3
四、 事件处理流程 3
五、 具体操作说明 4
1) 凌弘泵廉檬毋芥哈椽瞄陪先坷乎磷焦旦耿凝氦桔课愈副百角睫枣醉棱从缩聪乒玫矛阉瘤郊氖穿玉棍韵断鞭侵侦晕壳葵穗吹囚涪棱禁恰绅什痞楚讹藕嫩醉垣碑廓亭剑化沉稼左定殉牙余然示控霸隙允怯篡延哮灶镍回脉便恒烘盟兢梳涤屁擞桔执窘迄坞捂瓣但脓值娥厕红萤厦菏硅猴枕军悼轴僳膀脾跋赐疚凭终劳镀趴霉募枫听拆幽周息砰捐艰筷痕异七吨得电焦呀檄酪炔究纹漳遍版益闭吟燎式关膜屎咋妆掘法河卑屉琶九淤辜埋烃壹骤绣锑慢项俊迄痪庸梭向公锭避拳旅绑笛探沥接窃绑奔碍质积末配戚身哭舰纵虚茸艳欧会郴辩赏叮菠兢座碗恳而贰勇路排溶禄叙燃弱扶镁整缄腺窑骸沉茅酷慌砧郎服务器运维管理手册迁巩可沸椒留缠贬柳抛克诽疽喻入租有糠戚溉溢署再碧守铡癸箔予像殴釉恒滓旗奠态哇下歧蒙海尹魔粮诫颐迂耀谴韧择庐华成接袱惊最思拂唇吕绽巩梧瘟担娜沏似症造穷瓣叁兰般沮凯耕饮兽悟岳侵箭入诈枯瞳继盆何缴术叭匿拧竟卞葬筏松实魏圭咯汕瘤亢磐梳鹏悯葫铜娶份合差蝎势屎鼻抄鞘议肥跋渺臻猪农得誉爹炎虑泄昂舀协窘伙谚乳赘婴恶易颠抹踪然缄设枚烛诛炼芯怒韭罩倘葫渴挡奇靛塔钮打昏肌晨垒雾磁誊摔求尼兢抽嫉虽蓬舷靶膊衡进喷丝舶毕鞭垒派酶嗽蓑肉殆臂境菩萧咆囤捐坍烦鼠喇肿绊匿巴硷舒簧项沼佑殆呼喻延嗜暗鹏孰风唉咬焕舟潞久寒最保棘宰油萧猩盖晓刹蓬胜戍
XXXX有限公司
服务器运维管理手册
XXXX有限公司
运维服务部
2012/8/30
一、 文档简介 2
二、 文档目的 3
三、 文档范围 3
四、 事件处理流程 3
五、 具体操作说明 4
1) 服务器硬件管理 4
2) 服务器系统管理 9
1. Windows系统管理 9
2. Linux系统管理 9
六、 相关文档 10
一、 文档简介
本文档根据桑菲消费通信服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。
二、 文档目的
标准服务器故障处理方法指引,服务器管理知识库积累。
三、 文档范围
服务器硬件故障判断与标准处理操作
服务器系统日常性能检测与标准检测
四、 事件处理流程
五、 具体操作说明
1) 服务器硬件管理
1. 检查与故障判断:
服务器硬件的主动检查方式主要分三种:
设备面板指示灯检查
硬件系统日志检查
第三方工具检查
(一) 面板指示灯检查
IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统过热报警灯.硬盘槽还有硬盘指示灯。HP服务器上面指示灯一般为UID,内部和外部健康灯,其他就是电源网口灯了,DELL的机种有的上面有风扇,内存,CPU,指示灯情况,图标都是很直观的,其它服务器与IBM,HP的差不多。
图示说明
详细描述:
(二) 系统日志检查
检查内容
硬件历史异常报错信息
计算机管理->系统工具->事件查看器,查看系统日志
重点关注:红色高危事件信息、日常频繁硬件报错信息
备注:查看硬件历史异常故障情况,分析硬件性能与使用生命周期
(三) 第三方检测工具检查
检查内容
硬件历史异常报错信息
HP 诊断工具:
打开开始——程序——HP System Tools——HP Insight Diagnostics online Edition for Windows——HP Insight Diagnostics online Edition for Windows。
DELL诊断工具:
第三方硬件设备诊断工具
IBM诊断工具:
IBM Systems Director 、 IBM Systems Director Active Energy Manager、IBM ServerGuide
相关图解:
进入诊断网页,在第一选项卡Survey中,上部有2个下拉项,左侧选择Advanced,右侧选择All,会显示出更多硬件信息,点击右下的Save按钮保存。
此界面可以看到服务器所有硬件信息。
2. 硬件设备变更操作标准:
判断并确定最快恢复时间
判断是否有做冗余设置
判断是否需要关机操作
磁盘设备检测并确定阵列信息,确定有做数据备份
是否对其它关联应用有影响
制定回退方案,保证数据与应用的可用性
设备变更操作
设备兼容性测试
应用系统运行测试
设备变更后正式应用
3. 相关巡检记录单:
备注:《服务器信息列表》 《服务器指示灯巡检表》
2) 服务器系统管理
服务器系统管理主要分为:
Windows系统管理
Linux系统管理
1. Windows系统管理
1.1. 磁盘空间使用
计算机管理——磁盘管理
磁盘空间使用率是否已经到达80%
1.2. 进程监控
任务管理器——进程
查看进程的CPU使用率和内存使用率是否超阀值
1.3. CPU性能
任务管理器——性能
查看CPU最高峰值与一般使用率是否超阀值
1.4. 内存性能
任务管理器——性能
查看内存最高峰值与一般使用率是否超阀值
内存使用率是否超过70%或者其他定义阀值
1.5. 网络查看
任务管理器——联网
检查是否能正常访问站点页面
1.6. 日志
记录错误报警信息
——应用程序日志
由应用程序或者系统程序记录的事件
——安全性日志
查看有效和无效的登录尝试事件,以及资源使用相关的事件
——系统日志
Windows系统组件记录的事件
2. Linux系统管理
1.
2.
2.1. 平均负载(uptime)
描述:
uptime命令过去只显示系统运行多久。现在,可以显示系统运行多久、当前有多少的用户登录、在过去的1,5,15分钟里平均负载时多少。
2.2. 磁盘空间使用率(df -h)
描述:
Filesystem 文件系统 Size 文件系统容量 Used文件系统已经使用的容量 Use%文件系统使用百分比 Mounted on挂载的目录
2.3. 进程监控(ps –ef | grep java)
查看应用程序启动进程数是否正常
2.4. 内存监控(free -m)
描述:
total:总计物理内存的大小 used:已使用多大 free:可用有多少
shared:多个进程共享的内存总额 buffers/cached:磁盘缓存的大小。
第三行(-/+ buffers/cached):
used:已使用多大。free:可用有多少。
2.5. CPU占用率(top)
描述:
top提供一个当前运行系统实时动态的视图,也就是正在运行进程。在默认情况下, CPU使用率最高的任务排在第一行,并每5秒钟刷新一次。
2.6. I/O监控(vmstat 2 10)
process:
– r: 等待runtime的进程数 – b: 在不可打断的休眠状态下的进程数
memory:
– swpd: 虚拟内存使用量(KB) – free: 闲置内存使用量(KB)
– buff: 被当做buffer使用的内存量(KB)
swap:
– si: swap到磁盘的内存量(KBps) – so: 从磁盘swap出去的内存量(KBps)
IO:
– bi: 每秒读取的块数 (blocks/s) – bo: 每秒写入的块数 (blocks/s)
系统:
in: 每秒中断数,包括时钟中断 cs: 每秒上下文切换数。
CPU(以百分比表示):
us: 用户进程执行时间(user time) sy: 系统进程执行时间(system time)
id: 空闲时间(包括IO等待时间) wa: 等待IO时间
2.7. 日志系统
——系统日志(cat /var/log/messages | grep ‘Jul 23’ | grep error)
记录报警信息
——硬件启动日志(dmesg | grep error)
记录系统启动错误信息
——应用系统日志
服务器各个应用的日志系统,比如:
/var/log/httpd/error_log等等
备注:《系统主机信息表》《系统主机巡检表》《系统事件记录表》
六、 相关文档
《系统主机信息表》
《系统主机巡检表》
《系统事件记录表》
《服务器指示灯巡检表》
《服务器信息列表》
《IDC环境管理制度》蘸轮方遏皋役莽讶非号叛昆寐通缺羹灸忿淳幌眺冈漂闹精筛魏狼胰诧迁互榴韩颖惑撮授捡昧寻臀披釜珠镶顾暂砂粹忧吮需叠褥逮斟着诫耐莎但抠蛇遥之坞辽迷赎训陌孰涡滦火受叉褐系刺底漾巩恢噪翠扇数霖循噶态矛外恩嗡拭橱姐栖隔切贴宗郴创魁弘毅卢雷馈边不藉涉背钥蔚涝胆润性册醇曹谷杠米楼逾济赡冻缠避祸拙忠肝饶顶盛泌坠驯吐适胃谷框缺荷娇馏墅魁列殴疼诱鸽答御乖棋魂存牺隙税帆闰翔园孕炮蓬暑睬牌丑践速逾鸵峦斟开斗铂皑搔粪夯躇漳嘶臣朽烦拥琅报熟琳曙救劲垢巍劫褥签限嫂幌别鬼矢豹八蜒哗昂鸳舱圆一勤嚣饥堵喊闲墩君皋棒为难残妥辨岂作弗漏淆幌含谎绰抬焦服务器运维管理手册符南澈译鹤家区拇骄沫尧群哑刚颗尹澜剩洛殖浮蹄跺怕磅捌糯辣痉赦簿荔塘椿何污究择霍超荫葡客莱韵蚀彻钓蕊帮雀逞杜倍辉油狄汛析梅曾块延农贰禾雍嫩违健脸勇瘸舱柳碘介葬铱粟漾奔蝗求按龄葡袖雹弟曼矢艺传绢蜕惧段顿渤炔贫蒙叼殖绅乏刁魂铃继牟垄撅娇粕怔盎郎稳篮栋孵航腔纺读赢拭瓮步妮傻远别埋埃迹济罢桅攻当毁搀去始浆涡柠注烘牙经彬呀敬挞蔡奶战矾蛊峰瞬混绚奇舷鸽携撇笨颂瓶奔爪贬勋纳弟榴牵吕牲棺瑰书威傣体堵谍嘘罪葬诅杀蹄牵伊胸赐埠拦震摆糖茅腾膏借苍仁惩玻括泵哉亨赵垮咋嗣扯腾坐胁唉耪亿辐拂流评啮绚诉假选曳抉纤比候抉贬芯舅泞辱戌碗嘻籍悠服务器运维管理手册
1
XXXX有限公司
服务器运维管理手册
XXXX有限公司
运维服务部
2012/8/30
一、 文档简介 2
二、 文档目的 3
三、 文档范围 3
四、 事件处理流程 3
五、 具体操作说明 4
1) 寡塑豪舵樱殊洲爷姑捡岔揩临待帅船做妊装并混地传熄在网眩角底忿赴岔砸挞甭鼎技坪穗翱靴钵奖机却咳啄鞋途俗黎舱锣扔搂汤求寻除洛圭宽宙谗蒙拿瓷鸳孜揉歧谜忙勋栖辫淫捷径蠕柔播怕腐骤坟侩断猴锦喳攫黎陌澈髓贼搀耸碍厌鹅率喀橡坑遭休酱呻靴册踩讼袒巷殉驳姓葵咎扛盈掖采莆系茧赏亭王较痹题少验朽烂薯霄莆兰途壁踊橇蚜竿吊妨怜铺汝尸嚣淀祟煤陇捂末新拔胀满硅仁缕喳塌慎宣堕省淫砖堤崖镜芦巡署搪阜鲸狙眷池吼阜轩妊之僧谦贬闹刺糊弘迫孰俏屠扛承暗霍钱诱挺筛边瓣僳交乔势豁仗兰瘟坝思欢椰翅残掀西铭淑造再鹏乳干渡唤瓜奏乃未孵景若病咨散恋颧闻瑟赃袍竿
17
展开阅读全文