nemo****@zuku*****
nemo****@zuku*****
2012年 8月 3日 (金) 11:15:05 JST
根本と申します。 現在夜中に Heartbeat がmigrateし、その原因を調査しております。 [環境] OS : CentOS 5.6(正確には、Openvz Kernelです) # uname -a Linux 03ba.ss.jp 2.6.18-194.26.1.el5.028stab079.2 #1 SMP Fri Jan 28 20:28:13 JST 2011 x86_64 x86_64 x86_64 GNU/Linux) DRBD:8.3.4 pacemaker-1.0.10-1.4.el5(Linux-HA Japan提供) DRBD領域を2つ用意して、お互いがPrimary且つSecondaryにしています。 # cat /proc/drbd version: 8.3.4 (api:88/proto:86-91) GIT-hash: 70a645ae080411c87b4482a135847d69dc90a6a2 build by xemul****@ovzco*****, 2009-10-12 19:29:01 1: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r---- ns:0 nr:2069393748 dw:2069393724 dr:0 al:0 bm:183 lo:6 pe:0 ua:7 ap:0 ep:1 wo:f oos:0 2: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r---- ns:1325079308 nr:2386976 dw:1327465484 dr:121716917 al:63653921 bm:538 lo:198 pe:0 ua:0 ap:198 ep:1 wo:f oos:0 添付してあるログ(ha-log.log)を見る限り、Aug 03 03:31:18にリソースエージェントres_vps2の監視スクリプトがタイムアウトを起こしたのが原因のみたいなのですが res_vps2の監視自体は、非常に単純なもので、監視スクリプトが完了するまでに60s以上もかかるとは考えにくいと思います。 監視内容は、以下のコマンドを各VPS毎にうものです。 ---- 例 # vzctl status 3001 CTID 3001 exist mounted running ---- VPSのイメージはDRBD領域にあり、同時刻のDRBDトラフィックが急激に上がっています。 (graph.png参照) おそらく、I/Oにアクセスできず監視スクリプトが実行できず、タイムアウトしたものと考えていますが そもそも、DRBDの挙動として急激にトラフィック(write処理)が発生する事はあるのでしょうか。 個人的には、キャッシュで持っていたデータを一気にwriteするタイミングでもあるのかなとも 思いましたが、DRBDのprotocolは C に設定してます。(drbd.confも添付します) なにか原因と思われる情報や、切り分け方法等わかりますでしょうか。 また、DRBDの細かい挙動に関するドキュメント類は、どこかにあったりしますでしょうか。 (最悪ソースコードを追いかけるとか…) Heartbeat というよりは、DRBDの内容になるかと思いますがよろしくお願い致します。 ━━━━━━━━━━━━━━━━━━━━━━━━ 根本 稔也 E-mail nemo****@zuku***** ━━━━━━━━━━━━━━━━━━━━━━━━ -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: ha-log.log 型: application/octet-stream サイズ: 38023 バイト 説明: 無し Download -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: graph.png 型: image/png サイズ: 26863 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/linux-ha-japan/attachments/20120803/b4b051cb/attachment.png -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: drbd.conf 型: application/octet-stream サイズ: 2237 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/linux-ha-japan/attachments/20120803/b4b051cb/attachment-0001.obj