你正在下载：《

HACMP工作原理及运维管理.doc

》 [预览]

格式：DOC ，页数：9 ，大小：1.13MB ,
资源ID：7881378 下载积分：10 金币

快捷注册下载

登录下载

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

开通VIP

温馨提示：由于个人手机设置不同，如果发现不能下载，请复制以下地址【https://www.zixin.com.cn/docdown/7881378.html】到电脑端继续下载（重复下载【60天内】不扣币）。

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

三方登录：

1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

本文（HACMP工作原理及运维管理.doc）为本站上传会员【pc****0】主动上传，咨信网仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知咨信网（发送邮件至1219186828@qq.com、拔打电话4009-655-100或【微信客服】、【 QQ客服】），核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载【60天内】不扣币。【服务填表】

HACMP工作原理及运维管理.doc

1、 HACMP 工作原理及运维管理目录 1. HACMP双机系统的功能介绍 3 2. HACMP双机系统的工作原理 3 3. HACMP双机系统结构图 3 4. HACMP安装配置前需作的准备工作 4 5. HACMP的常用命令 4 6. HACMP常见故障解决 6 1. HACMP双机系统的功能介绍 Hacmp（High Availability Cluster Multi-Processing）双机热备份软件的主要功能是提高客户计算机系统及其应用的可靠性，而不是单台主机的可靠性。 2. HACMP双机系统的工作原理 1.作为双机

2、系统的两台服务器（主机A和B）同时运行Hacmp软件 2.服务器除正常运行自机的应用外，同时又作为对方的备份主机 3.两台主机系统（A和B）在整个运行过程中，通过“心跳线”相互监测对方的运行情况（包括系统的软硬件运行、网络通讯和应用运行情况等） 4.一旦发现对方主机的运行不正常（出故障）时，故障机上的应用就会立即停止运行，本机（故障机的备份机）就会立即在自己的机器上启动故障机上的应用，把故障机的应用及其资源（包括用到的IP地址和磁盘空间等）接管过来，使故障机上的应用在本机继续运行 5.应用和资源的接管过程由Ha软件自动完成，无需人工干预 6. 当两台主机正常工作时，也可以根据需要将其

3、中一台机上的应用人为切换到另一台机(备份机)上运行 3. HACMP双机系统结构图 4. HACMP安装配置前需作的准备工作 1. 划分清楚两台服务器主机各自要运行的应用(如A机运行应用，B机作为standby） 2. 给每个应用(组)分配Service_ip、Standby_ip、boot_ip和心跳线tty， 3. 按照各主机的应用的要求，建立好各自的磁盘组，并分配好磁盘空间 4. 根据Ha软件的要求，对服务器操作系统的参数作必要的修改 5. HACMP的常用命令 1、查看Cluster的运行情况： # /usr/sbin/cluster/clinfo –a # /

4、usr/sbin/cluster/clstat /usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。屏幕会如下显示： 2、启动HACMP： # smitty clstart 注：有两种启动HACMP的方式： now：手工启动HACMP restart、both：在系统启动时自动启动HACMP 3、停止HACMP： # smitty clstop 注：有三种停止方式： graceful：只停止本节点上HACMP的运行，并释放由本节点管理的资源，但允许其它节点接管。 graceful with takeover：停止本节点上HAC

5、MP的运行，释放资源，让其他节点接管。 forced：停止本节点上HACMP的运行，但不释放资源。 4、查看Cluster的进程状态： # ps –ef | grep cluster 注：应有三个HACMP进程：clstrmgr、clinfo、clsnuxpd 5、查看Cluster的日志及错误信息： # more /tmp/hacmp.out # more /var/adm/cluster.log 注：可以在启动HACMP时使用 # tail –f /tmp/hacmp.out命令，以查看HACMP的启动是否正常或跟踪启动时的错误信息。 6、查看Cluster运行的历

6、史记录： # cd /usr/sbin/cluster/history 注：此目录下存放着每天的Cluster运行记录 7、查看Cluster运行时的网络情况及资源组的使用情况： HACMP启动之前： # netstat –i 此时应可以看到boot和standby地址 # lsvg –o 此时只能看到本地的VG HACMP启动之后： # netstat –i 此时应可以看到service和standby地址 # lsvg –o 此时应可以看到本地的VG及共享VG 6. HACMP常见故障解决导致集群中节点失效的无反映开关（Deadman Switch）

7、问题现象：集群中的节点经历着极端的性能问题，如：大量的I/O传输、过多的错误记录、内存不足等，导致集群管理器（clstrmgr）没有得到足够的CPU处理时间，而引起无反映开关在分配的时间被重置。某个应用程序运行权限高过集群管理器时，会导致此问题。解决方法：术语“Deadman Switch”指的是在特定集群条件下，未能及时重置该开关，引起系统宕机和转储的内核扩展部分。无反映开关在超过了特定的时间限制后会宕掉处于挂起状态的节点。此过程导致集群中的其它节点接管处于挂起状态节点的资源。要解决此问题需要解决与之相关的几个性能问题： 1、调整系统I/O pacing 2、增加信息同

8、步（syncd）的频率 3、增加通信子系统使用的内存量 4、更改错误探测速率调整系统使用I/O的步调：使用I/O pacing调整系统，使得在大量写操作时，系统资源的分配更合理。为HACMP集群激活I/O Pacing是必要的，尤其是在集群中可能会有大量磁盘数据块写操作的时侯。按下述步骤修改I/O Pacing设置： # smitty hacmp Cluster Configuration Advanced Performance Tuning Parameters Change/Show I/O Pacing 修改HIGH water mark for pen

9、ding write I/Os per file域，推荐值为33，可用值在0－32767之间。修改LOW watermark for pending write I/Os per file域，推荐值为24，可用值在0－32767之间。不同的系统，以上两个值也不同。修改上两个值只能稍微减少写次数，通常能够解决上述问题。增大syncd的运行频率：增加syncd的运行频率，使缺省60秒运行一次变为30秒、20秒或10秒运行一次。这样可以强迫增加I/O刷新速率，并减少由于沉重的I/O流量触发无反映开关的可能性。按下述步骤修改syncd运行频率设置： # smitty hacm

10、pCluster Configuration Advanced Performance Tuning Parameters Change/Show syncd frequency 修改syncd frequency in seconds域，推荐值为10秒，可用值在0－32767之间。增加通信子系统可用的内存量：如果运行命令：# netstat –m，发现请求mbuf被拒绝，或运行命令# errpt发现LOW_MBUFS 错误，则应增加网络参数“thewall”的值。Thewall的缺省值为25％的系统实内存。可以将其增加为50％的系统实内存。按下述步骤修改thewall值的设置： # vi /etc/ 在此文件的末尾加入： no -o thewall= xxxxxxxxxx是指你希望设置的供通信子系统使用的实内存值。如： no -o thewall=10240 修改错误探测速率：如果激活I/O Pacing或增加Syncd运行频率不能解决无反映开关不能重置的问题时，则修改错误探测速率，将其值该为Slow。这样可以延长一个挂起节点调用无反映开关之前，以及接管节点探测到节点故障并获得挂起节点资源之前所需的时间。注意：在完成上述步骤之前，I/O Pacing必须先激活。这是因为修改此设置会调整I/O数据的传输量。 9