[Linux-ha-jp] ddコマンドファイルを出力すると、仮想IPがtime outしてしまう

Back to archive index

kinos****@tdc***** kinos****@tdc*****
2010年 4月 1日 (木) 22:02:31 JST


木下です。


現在、heartbeat+drbd構成にて、DBサーバーを構築中なのですが、
同期用のケーブルを抜いて、一時的にWFconnection状態を作り、
その間にファイルを更新させ差異を作り、それから同期ケーブルを接続して、
SyncSourceにて同期させる時間計測検証を実施しようとしています。
差異については、ダミーファイルをDRBDのミラーパーテションではなく、
ローカルにddコマンドにてファイル作成をしてから、コピーさせようとしました。

ddコマンドを実施して、大体50秒を過ぎたあたりから仮想IPのモニタから、
タイムアウトを検知して、リソースを切替するアクションが動きます。

いろいろ試したところ、同期ケーブルを接続した状態でも発生して、

slaveサーバーに完全に切り替わることはなく、仮想IPを再度起動させる
ために、その他リソースをstopしてから、再度startさせて正常に戻ります。

cib.xmlで仮想IPのtimeout値をデフォルトの5sから10sに変えても発生して
しまうのですが、これは何故発生してしまうのか、仮想IPをtimeoutさせない
方法がございましたら、教えていただけないでしょうか。
timeout値を10s以上にした場合、本当の障害の時に系切替が遅くなると困るので
これ以上timeout値を増やす方向は考えていません。

ファイルは、ddコマンドにてこのように作成しています。

dd if=/dev/zero of=/hoge/hogehoge.txt bs=1M count=その容量分の回数

どれくらいの大きさで発生するか、確認したところ、
50Gの1フアイル=timeout発生
1Gの1ファイルx50(for文にて50回繰り返し)=timeout発生

と、総容量が同じでも1ファイルが大きくても小さくても発生して、

ミニマムとして、調べた結果、1ファイルをddで8.8Gより大きい容量で
作成すると仮想IPのタイムアウトが発生いたします。
(この容量が大体50秒のきわでした)

環境は、以下です。

CentOS4.8 2.6.9-89.ELsmp
heartbeat 2.1.3-3(v2モードで利用)
drbd 8.3.2-6
postgresql 8.4.1

eth0がサービスポート
eth1が同期ポート
ttyS0がシリアルの同期ポート

cibの設定ファイルと、発生した時のログを添付します。

(See attached file: 仮想IPタイムアウト.zip)
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: 仮想IPタイムアウト.zip
型:         application/zip
サイズ:     4695 バイト
説明:       無し
Download 



Linux-ha-japan メーリングリストの案内
Back to archive index