[Linux-ha-jp] スプリットブレイン時の回復方法

Back to archive index

TAKATSUKA Haruka haruk****@sra*****
2014年 1月 22日 (水) 10:21:10 JST


高塚です。

クラスタ管理部が corosync の場合については詳しく把握していませんが、
heartbeat の場合についていえば、
双方が DC を名乗っている状態になった後で相互通信が復旧したとして、
少なくとも片方の heartbeat プロセスを再起動をしないと、スプリット
ブレインを解消できないと思います。

STONITH プラグインを組み込んでおいて、crm から fence を発動させる
としても、結局ホストリブートの類を行うことになります。

ただし、双方が DC である状態になったとしても、リソースレベルでは、
両ノードでの起動を回避ということはできます。単に、片方のノードにて
crm コマンドでリソース停止すればよいわけです。vipcheck や sfex は
これを自動で行うために使う RA といえます。
でも、これは「回避」であって、「回復」ではないですね。


On Tue, 21 Jan 2014 11:36:45 +0900
mlus <mlus****@39596*****> wrote:

> コヤマと申します。
> 
> ホストの環境
> 2台( サービス回線:1  インライン回線:1)
> 
> Pacemakerの環境
> リソース:IPaddr2, ping, MailTo
> 
> 障害のタイプ
> ホストの一方のNIC(USBのNIC)が故障したという想定で、
> 差し替えを行う。
> 
> スタンバイ時からの回復などはマニュアルを読んで理解したのですが、
> スプリットブレインになった場合の方法がわかりません。
> 
> スプリットブレイン障害時に、ホストをリブートさせないで、
> crmコマンドなどのコンソールツールを使って回復させる方法を
> ご教授頂けませんでしょうか。
> 
> 宜しくお願い致します。
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
______________________________________________________________________
 高塚 遙  haruk****@sraos*****  SRA OSS, Inc  http://www.sraoss.co.jp





Linux-ha-japan メーリングリストの案内
Back to archive index