Recent Changes

2011-05-06
2011-02-22
2011-02-18
2011-02-16
2011-02-15

Latest File Release

[1-01] pm_extra_tools: Pacemaker-2系追加パッケージ (RHEL8以降) (1.5-1 (RHEL8/RHEL9))2023-09-20 13:00
[2-01] Pacemaker-1.1系リポジトリパッケージ (RHEL7) (1.1.21-1.1)2019-10-02 13:00
[2-02] Pacemaker-1.1系/1.0系リポジトリパッケージ (RHEL6) (1.1.21-1.1)2019-10-02 13:00
[2-03] Pacemaker-1.0系リポジトリパッケージ (RHEL5) (1.0.13-2.1)2014-08-13 09:28
[2-10] pm_ctl : 運用管理連携機能 (1.0-1)2012-11-05 11:20
[2-11] pm_logconv-cs : ログメッセージ制御機能(Corosync対応) (1.0-1)2012-11-12 09:53
[3-01] Heartbeat (RedHat/CentOS用rpmパッケージ) (2.1.4-1)2008-08-28 09:53
[3-02] hb-monitor:クラスタ状態表示機能 (1.03-1)2011-02-16 07:21
[3-03] hb-extras:拡張リソースエージェント・プラグイン (1.02-1)2011-02-16 07:21
[3-04] hb-logconv:ログメッセージ制御機能 (1.02-1)2011-02-16 07:21
[3-05] hb-cibgen:cib.xml編集ツール (1.03-1_1)2009-11-16 13:31
[3-06] hb-diskd:ディスク監視デーモン (1.10-1)2010-01-22 10:20
[3-07] VIPcheck:VIPcheckリソースエージェント (1.1)2009-11-30 07:21
[3-08] hb-sfex:共有ディスク排他制御 (1.30-1)2010-01-22 10:00
[3-09] hb-logmoni:ロギングデーモン監視 (2.00-1)2010-01-22 10:10
[3-10] hb-ipv6:IPv6対応追加パッケージ (1.00-1)2010-01-29 07:21
[3-11] hb-vmmonitor:デバイス一括監視機能 (1.00-1)2010-06-11 07:21
[3-12] vm-logd-monitor:ログデーモン監視機能(Domain-0用) (1.00-1)2010-06-11 07:21
[3-13] stonith-wrapper2:STONITHラッパープラグイン2 (2.00)2010-06-18 07:21
[3-14] hb-actmonitor:フェイルオーバ抑止機能 (1.00-1)2010-11-26 07:21

Wiki Guide

Side Bar

hb_logconv 出力ログメッセージ一覧

リソース監視・制御時のメッセージ一覧

No イベント レベル メッセージ 意味
1-1 リソースの起動 開始INFOResource prmPg tries to start.リソースID”prmPg”を起動(start)します。
1-2リソースの起動 終了(成功)INFOResource prmPg started. (rc=0)リソースID”prmPg”の起動(start)が正常に終了(rc=0)しました。
1-3リソースの起動 終了(エラー)ERRORResource prmPg failed to start. (rc=1)リソースID”prmPg”の起動(start)でエラー(Error)が発生しました。
1-4リソースの起動 終了(タイムアウト)ERRORResource prmPg failed to start. (Timed Out)リソースID”prmPg”の起動(start)でタイムアウト(Timed Out)が発生しました。
2-1リソースの停止 開始INFOResource prmPg tries to stop.リソースID”prmPg”を停止(stop)します。
2-2リソースの停止 終了(成功)INFOResource prmPg stopped. (rc=0)リソースID”prmPg”の停止(stop)が正常に終了(rc=0)しました。
2-3リソースの停止 終了(エラー)ERRORResource prmPg failed to stop. (rc=1)リソースID”prmPg”の停止(stop)でエラー(Error)が発生しました。
2-4リソースの停止 終了(タイムアウト)ERRORResource prmPg failed to stop. (Timed Out)リソースID”prmPg”の停止(stop)でタイムアウト(Timed Out)が発生しました。
3-1リソースの監視 終了(故障)ERRORResource prmPg failed to monitor. (rc=1)リソースID”prmPg”の監視(monitor)で、故障が発生している(rc=1)ことを検知しました。
3-2リソースの監視 終了(停止検知)ERRORResource prmPg does not work. (rc=7)リソースID”prmPg”の監視(monitor)で、リソースが停止している(rc=7)ことを検知しました。
3-3リソースの監視 終了(タイムアウト)ERRORResource prmPg failed to monitor. (Timed Out)リソースID”prmPg”の監視(monitor)で、タイムアウト(Timed Out)が発生しました。
4-1リソースのMaster化 開始INFOResource master_slave_Stateful0:1 tries to promote.リソースID”master_slave_Stateful0:1”をMaster化(promote)します。
4-2リソースのMaster化 終了(成功)INFOResource master_slave_Stateful0:1 promoted. (rc=0)リソースID”master_slave_Stateful0:1”のMaster化(promote)が正常に終了(rc=0)しました。
4-3リソースのMaster化 終了(エラー)ERRORResource master_slave_Stateful0:1 failed to promote. (rc=1)リソースID”master_slave_Stateful0:1”のMaster化(promote)でエラー(rc!=0)が発生しました。
4-4リソースのMaster化 終了(タイムアウト)ERRORResource master_slave_Stateful0:1 failed to promote. (Timed Out)リソースID”master_slave_Stateful0:1”のMaster化(promote)でタイムアウト(Timed Out)が発生しました。
5-1リソースのSlave化 開始INFOResource master_slave_Stateful0:0 tries to demote.リソースID”master_slave_Stateful0:0”をSlave化(demote)します。
5-2リソースのSlave化 終了(成功)INFOResource master_slave_Stateful0:0 demoted. (rc=0)リソースID”master_slave_Stateful0:0”のSlave化(demote)が正常に終了(rc=0)しました。
5-3リソースのSlave化 終了(エラー)ERRORResource master_slave_Stateful0:0 failed to demote. (rc=1)リソースID”master_slave_Stateful0:0”のSlave化(demote)でエラー(rc!=0)が発生しました。
5-4リソースのSlave化 終了(タイムアウト)ERRORResource master_slave_Stateful0:0 failed to demote. (Timed Out)リソースID”master_slave_Stateful0:0”のSlave化(demote)でタイムアウト(Timed Out)が発生しました。

ノード状態変更時のメッセージ一覧

No イベント レベル メッセージ 意味
6-1ノード状態 故障/停止WARNNode hb01 is dead.ノード“hb01”が故障/停止(dead)(クラスタメンバシップから離脱)しました。
6-2ノード状態 回復/起動INFONode hb01 is active.ノード”hb01”が起動/回復(active)(クラスタメンバシップへ参加)しました。

インターコネクトLAN状態変更時のメッセージ一覧

No イベント レベル メッセージ 意味
7-1インターコネクトLAN状態 故障/停止WARNLink srv02:eth3 is dead.ノード”srv02”のインターコネクトLAN”eth3”の故障/停止(dead)を検知しました。
7-2インターコネクトLAN状態 回復/起動INFOLink srv02:eth3 is up.ノード”srv02”のインターコネクトLAN”eth3”の回復/起動(up)を検知しました。

ネットワーク監視の状態変更時のメッセージ一覧

No イベント レベル メッセージ 意味
8-1ネットワーク監視 故障ERRORNetwork to 192.168.44.14 is dead.ネットワーク監視で、故障(dead)を検知しました(監視先IPアドレス”192.168.44.14”に対して通信ができませんでした)。
8-2ネットワーク監視 回復INFONetwork to 192.168.44.14 is up.ネットワーク監視で、回復(up)を確認しました(監視先IPアドレス”192.168.44.14”に対して通信が可能になりました) 。

ディスク監視の状態変更時のメッセージ一覧

No イベント レベル メッセージ 意味
9-1ディスク監視 故障ERRORDisk connection has ERROR.ディスク監視で、故障(ERROR)を検知しました。
9-2ディスク監視 回復INFODisk connection is normal.ディスク監視で、回復(normal)を確認しました。

respawnプロセス制御のメッセージ一覧

No イベント レベル メッセージ 意味
10-1起動INFOStarting "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" as uid 0 gid 0 (pid 20732)ユーザーID 0, グループID 0のユーザーとして、respawnプロセス”/usr/lib/heartbeat/pingd -a default_ping_set -m 100”を、プロセスID20732で起動します。
10-2異常終了①(エラー発生による終了)WARNManaged "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" process (pid 20732) exited. (exit code=1)respawnプロセス”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” (プロセスID20732) が、終了コード1で終了しました。
10-3異常終了②(シグナルによる終了)WARNManaged "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" process (pid 20732) killed by signal 9.respawnプロセス”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” (プロセスID20732) がシグナル9番によってkillされました。
10-4異常終了③(コアダンプ)WARNManaged "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" process (pid 20732) dumped core.respawnプロセス”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” (プロセスID20732) がコアダンプしました。
10-5異常終了④(上記以外)WARNManaged "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" process (pid 20732) went away strangely (!)respawnプロセス”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” (プロセスID20732) が、なんらかの原因で異常終了しました。
10-6正常終了INFOStop "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" process normally. (killing pgid 20732 with signal 15)Heartbeatサービス終了に伴い、 ”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” (プロセスID20732) を、シグナル15番によって終了させました。
10-7短期間に複数回異常終了ERRORRespawning "/usr/lib/heartbeat/pingd -a default_ping_set -m 100" too fast in a short term.respawnプロセス ”/usr/lib/heartbeat/pingd -a default_ping_set -m 100” が短期間に10回以上異常終了しました。

DC遷移時のメッセージ一覧

No イベント レベル メッセージ 意味
13-1DC遷移 開始INFOStart to elect a DC node.DCノードの選出(S_ELECTION)を開始しました。
13-2DC遷移 開始処理終了INFOSet DC node to hb01. ノード"hb01"がDCノードに選出されました。
13-3DC停止INFODC node is dead.DCノードが正常に停止しました。
13-4DC故障WARNDC node (hb02) left the cluster.DCノード"hb02"がクラスタメンバから離脱しました。
13-5DC剥奪INFOUnset DC node hb02.ノード"hb02"がDCノードではなくなりました。

Heartbeatサービス起動・終了時のメッセージ一覧

No イベント レベル メッセージ 意味
14-1Heartbeatサービスshutdown 開始 service heartbeat stop or kill pidINFOHeartbeat on hb01 is shutting down.ノード"hb01"がshutdownを開始しました。
14-2 終了(自ノード)INFOHeartbeat shutdown complete.自ノード(ノード"hb01")上のHeartbeatのshutdownが完了しました。
14-3自ノード停止INFOHeartbeat is shutting down.自ノード上のHeartbeatのshutdown処理を開始します。

Heartbeatのログデーモン起動・終了時のメッセージ一覧

No イベント レベル メッセージ 意味
15-1ログデーモン起動INFOlogd started with /etc/logd.cf.ロギングデーモンを起動しました。設定ファイルは/etc/logd.cfです。
16-1ログデーモン終了 開始INFOlogd is shutting down.ロギングデーモンを終了します。(シグナルSIGTERMを受信しました)
16-2ログデーモン終了 終了INFOlogd stopped.ロギングデーモンが終了しました。

STONITH実行時のメッセージ一覧

No イベント レベル メッセージ 意味
17-1STONITHリソース起動 開始INFOResource prmStonithN2 tries to start.リソースID”prmStonithN2”を起動(start)します。
17-2STONITHリソース起動 終了(成功)INFOResource prmStonithN2 started. (rc=0)リソースID”prmStonithN2”の起動(start)が正常に終了(rc=0)しました。
17-3STONITHリソース起動 終了(エラー)ERRORResource prmStonithN2 failed to start. (rc=1)リソースID”prmStonithN2”の起動(start)でエラー(Error)が発生しました。
17-4STONITHリソース起動 終了(タイムアウト)ERRORResource prmStonithN2 failed to start. (Timed Out)リソースID”prmStonithN2”の起動(start)でタイムアウト(timed out)が発生しました。
18-1 STONITHリソース停止 開始INFOResource prmStonithN2 tries to stop.リソースID”prmStonithN2”を停止(stop)します。
18-2 STONITHリソース停止 終了(成功)INFOResource prmStonithN2 stopped. (rc=0)リソースID”prmStonithN2”の停止(stop)が正常に終了(rc=0)しました。
19-1STONITHリソース監視 終了(故障)ERRORResource prmStonithN2 failed to monitor. (rc=14)リソースID”prmStonithN2”の監視(monitor)で、故障が発生している(rc=EXECRA_STATUS_UNKNOWN)ことを検知しました。
19-2STONITHリソース監視 終了(停止検知)ERRORResource prmStonithN2 does not work. (rc=7)リソースID”prmStonithN2”の監視(monitor)で、リソースが停止している(rc=EXECRA_NOT_RUNNING)ことを検知しました。
19-3STONITHリソース監視 終了(タイムアウト)ERRORResource prmStonithN2 failed to monitor. (Timed Out)リソースID”prmStonithN2”の監視(monitor)でタイムアウト(timed out)が発生しました。
20-1fence(ローカル) 開始INFOTry to STONITH (RESET) the Node hb01 to device external (rsc_id=prmStonithN1, pid=10269)リソースID"prmStonithN1"で、ノードhb01に対するfence(RESET)処理を開始します。
20-2fence(ローカル) 終了(成功)INFOSucceeded to STONITH (RESET) the Node hb01 by Node hb02.ノードhb02からノードhb01に対するfence(RESET)処理が成功しました。
20-3fence(ローカル) 終了(エラー)ERRORFailed to STONITH the Node hb01 with one local device (exi tcode=5). Will try to use the next local device.hb01に対するfence処理が失敗(exitcode=5)しました。次のローカルデバイスによる処理を試行します。
20-4fence(ローカル) 終了(タイムアウト)ERRORFailed to STONITH (RESET) the Node hb01 (Timed Out).hb01に対するfence(RESET)処理が失敗(Timed Out)しました。
21-1fence(リモート) 開始INFOTry to STONITH (RESET) the Node hb02 to device external (rsc_id=prmStonithN2, pid=32023)リソースID"prmStonithN2"で、ノードhb02に対するfence(RESET)処理を開始します。
21-3fence(リモート) 終了(エラー)ERRORFailed to STONITH the Node hb02 with one local device (exi tcode=5). Will try to use the next local device.hb02に対するfence処理が失敗(exitcode=5)しました。次のローカルデバイスによる処理を試行します。
21-4fence(リモート) 終了(タイムアウト)ERRORFailed to STONITH (RESET) the Node hb02 (Timed Out).hb02に対するfence(RESET)処理が失敗(TIMEOUT)しました。

stonith-wapper関連のメッセージ一覧

No イベント レベル メッセージ 意味
26-1sfex_stat使用不可ERRORUnable to use sfex_statsfex_statコマンドが使用不可能となっています。
26-2status失敗ERRORibmrsa-telnet failed to do status actionibmrsa-telnetに対する監視(status)アクションが失敗しました。

Coreプロセス関連のメッセージ一覧

No イベント レベル メッセージ 意味
28-1FIFO再起動(開始)WARNRestarting HBFIFO process.FIFOプロセスを再起動します。
28-2FIFO再起動完了(失敗)ERRORHBFIFO restart failed. Restarting heartbeat.FIFOプロセスの再起動に失敗しました。
28-3I/Oプロセス故障発生WARNHBWRITE process died. Beginning communications restart process for comm channel 0."heartbeat: write"プロセスが故障しました。チャンネル0番の通信を再起動します。
28-4I/Oプロセス再起動 (開始)WARNBoth comm processes for channel 0 have died. Restarting.チャンネル0番の両通信が切断しました。再起動します。
28-5I/Oプロセス再起動 完了(成功)INFOCommunications restart succeeded.通信の再起動に成功しました。
28-6I/Oプロセス再起動 完了(失敗)ERRORCommunications restart failed. Will try again later.通信の再起動に失敗しました。後ほど再試行します。

tengineおよびpengine関連のメッセージ一覧

No イベント レベル メッセージ 意味
29-1tengine/pengine起動INFOStarting crmd subsystem "pengine"."pengine"を起動しました。
29-2tengine/pengine終了(異常・正常とも)INFOcrmd Managed "pengine" process (pid 2502) exited. (signal=0, exit code=0)"pengine"がsignal=0, exitcode=0で終了しました。
29-3tengine/pengine異常終了ERRORcrmd sybsystem "pengine" terminated unexpectedly."pengine"が予期せず終了しました。

他プロセス故障関連

No イベント レベル メッセージ 意味
30-1master controll process ERROREmergency Shutdown: Master Control process died.Master Control processが終了しました。緊急shutdownします。
30-2プロセス故障によるOS再起動ERRORRebooting system. Reason: /usr/lib64/heartbeat/cib/usr/lib64/heartbeat/cibの故障により、システム(OS)を再起動します。

フェイルオーバ開始を表すメッセージ一覧

No イベント レベル メッセージ 意味
F0-0F/O 開始ERRORStart to fail-over.フェイルオーバーを開始しました。

ノード故障

No イベント レベル メッセージ 意味
F7-5Heartbeatサービスshutdown DC故障WARNDC node (hb02) left the cluster.DCノード"hb02"がクラスタメンバから離脱しました。

フェイルオーバ完了時のリソース状態を表すメッセージ一覧

No イベント レベル メッセージ 意味
F11-1リソース(OCF, STONITH問わず) 開始INFOResource prmEx : Started on hb02リソースID"prmEx"はノード"hb02"で稼働中です。
F11-2リソース 停止ERRORResource prmEx : StoppedリソースID"prmEx"は停止しています。
F11-3 リソース 配置移動なしINFOResource prmEx : Started on hb01リソースID"prmEx"はノード"hb01"で稼働中です。
F11-4リソース F/O失敗ERRORResource prmEx : StoppedリソースID"prmEx"は停止しています。
F11-5 リソース UnmanagedERRORUnmanaged resource exists.クラスタ内にUnmanaged(Heartbeatの管理外)のリソースがあります。

フェイルオーバの成否を表すメッセージ一覧

No イベント レベル メッセージ 意味
F12-1F/O 成功INFOfail-over succeeded.フェイルオーバーが成功しました。
F12-2F/O 失敗ERRORfail-over failed.フェイルオーバーが失敗しました。

その他メッセージ

No イベント レベル メッセージ 意味
22-1属性値 更新INFOAttribute "default_ping_set" is updated to "0".属性値 "default_ping_set" の値を "0" に更新しました。
23-1自ノードでHB起動 起動INFOStarting Heartbeat 2.1.4.自ノード上でHeartbeat2.1.4を起動します。
25-1ログ欠落ERRORcl_log: 12 messages were dropped12件のメッセージを出力できませんでした。(ha-logに対して、12件のメッセージが出力されませんでした。)

ログメッセージ制御機能(hb_logconv)
このリリースのファイルを表示