mlus
mlus****@39596*****
2014年 1月 16日 (木) 00:26:20 JST
コヤマです。 山内 さん、ご返答ありがとうございます。 > ご指摘の通りcorosync環境(及び、Heartbeatのv2モード以降)では、シリアルポートでのHA通信は利用できません。 > > インターコネクト回線は専用でも併用でも個人的には回線の負荷状況によりますが、利用可能だと思っています。 やはり、シリアルポート経由ではインターコネクト回線はできないのですね。 LANポート利用でも併用されておられるということなので、私もそうしたいと思います。 corosync-2.3.1 pacemaker-1.1.10 host1 host2 eth0(192.168.1.7) --- eth0(192.168.1.254) ===== coronosync.conf ============ totem { version: 2 crypto_cipher: none crypto_hash: none secauth: off interface { ringnumber: 0 bindnetaddr: 192.168.1.0 mcastaddr: 239.255.1.1 mcastport: 5405 ttl: 1 } } logging { fileline: off to_stderr: no to_logfile: yes logfile: /var/log/cluster/corosync.log to_syslog: yes debug: off timestamp: on logger_subsys { subsys: QUORUM debug: off } } quorum { provider: corosync_votequorum expected_votes: 2 } ==================================== 上記構成で試した所、ちょっとしたトラブルに見舞われています。 # corosync-cfgtool -s Printing ring status. Local node ID -1062731513 RING ID 0 id = 192.168.1.7 status = ring 0 active with no faults duo:/etc/corosync # # corosync-quorumtool -l Membership information ---------------------- Nodeid Votes Name 3232235783 1 host1.private.com (local) 3232236030 1 host2.private.com (ホスト名は、書き換えてあります) # corosync-cmapctl | grep members runtime.totem.pg.mrp.srp.members.3232235783.config_version (u64) = 0 runtime.totem.pg.mrp.srp.members.3232235783.ip (str) = r(0) ip(192.168.1.7) runtime.totem.pg.mrp.srp.members.3232235783.join_count (u32) = 1 runtime.totem.pg.mrp.srp.members.3232235783.status (str) = joined runtime.totem.pg.mrp.srp.members.3232236030.config_version (u64) = 0 runtime.totem.pg.mrp.srp.members.3232236030.ip (str) = r(0) ip(192.168.1.254) runtime.totem.pg.mrp.srp.members.3232236030.join_count (u32) = 1 runtime.totem.pg.mrp.srp.members.3232236030.status (str) = joined ここで問題なのが、 corosync-cfgtool -s した時の ノードIDは -1062731513 なのに、 corosync-quorumtool -l した時のノードIDが 3232235783 になっていることです。 本家のマニュアルでは、この値は各ホストごとに、同じ値になっていましたが、自分の環境では異なる値が出ている点です。 これが、設定ミスによるものなのか、それともパッケージに問題があるのかが判断できないでおります。 # crm_mon -1 Last updated: Thu Jan 16 00:18:49 2014 Last change: Thu Jan 16 00:11:29 2014 by hacluster via crmd on host1.private.com Stack: corosync Current DC: host1.private.com (3232235783) - partition with quorum Version: 1.1.10-1.2-d9bb763 2 Nodes configured 0 Resources configured Online: [ host1.private.com host2.private.com ] crm_mon を見る限り、同期がとれていますし、 crm configure property no-quorum-policy=ignore などのセットアップをActiveで行うと、 ちゃんと、standbyの方で反映されています。 もうひとつの問題は、systemctl stop pacemaker.service や systemctl stop corosync.service した際に、素直に停止できず、30分〜1時間ほどハングアップしてしまう点です。 これが、systemdによる不具合なのか、pacemakerやcorosyncのパッケージ問題なのかが判断できていません。 もし、ご経験されておられる方がいらっしゃいましたら、情報を頂ければ幸いです。