kinos****@tdc*****
kinos****@tdc*****
2010年 4月 1日 (木) 22:02:31 JST
木下です。 現在、heartbeat+drbd構成にて、DBサーバーを構築中なのですが、 同期用のケーブルを抜いて、一時的にWFconnection状態を作り、 その間にファイルを更新させ差異を作り、それから同期ケーブルを接続して、 SyncSourceにて同期させる時間計測検証を実施しようとしています。 差異については、ダミーファイルをDRBDのミラーパーテションではなく、 ローカルにddコマンドにてファイル作成をしてから、コピーさせようとしました。 ddコマンドを実施して、大体50秒を過ぎたあたりから仮想IPのモニタから、 タイムアウトを検知して、リソースを切替するアクションが動きます。 いろいろ試したところ、同期ケーブルを接続した状態でも発生して、 slaveサーバーに完全に切り替わることはなく、仮想IPを再度起動させる ために、その他リソースをstopしてから、再度startさせて正常に戻ります。 cib.xmlで仮想IPのtimeout値をデフォルトの5sから10sに変えても発生して しまうのですが、これは何故発生してしまうのか、仮想IPをtimeoutさせない 方法がございましたら、教えていただけないでしょうか。 timeout値を10s以上にした場合、本当の障害の時に系切替が遅くなると困るので これ以上timeout値を増やす方向は考えていません。 ファイルは、ddコマンドにてこのように作成しています。 dd if=/dev/zero of=/hoge/hogehoge.txt bs=1M count=その容量分の回数 どれくらいの大きさで発生するか、確認したところ、 50Gの1フアイル=timeout発生 1Gの1ファイルx50(for文にて50回繰り返し)=timeout発生 と、総容量が同じでも1ファイルが大きくても小さくても発生して、 ミニマムとして、調べた結果、1ファイルをddで8.8Gより大きい容量で 作成すると仮想IPのタイムアウトが発生いたします。 (この容量が大体50秒のきわでした) 環境は、以下です。 CentOS4.8 2.6.9-89.ELsmp heartbeat 2.1.3-3(v2モードで利用) drbd 8.3.2-6 postgresql 8.4.1 eth0がサービスポート eth1が同期ポート ttyS0がシリアルの同期ポート cibの設定ファイルと、発生した時のログを添付します。 (See attached file: 仮想IPタイムアウト.zip) -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: 仮想IPタイムアウト.zip 型: application/zip サイズ: 4695 バイト 説明: 無し Download