[Linux-ha-jp] RHEL上でのPacemakerの挙動に関して

Back to archive index
renay****@ybb***** renay****@ybb*****
2024年 8月 21日 (水) 18:32:19 JST


牧野さん

こんにちは、山内です。

MQなどの知識はないのでPacemaker的なお話で回答させていただきます。

まず、Pacemakerのバージョンですが、Pacemaker 0.10.12とありますが、正確ではないと思われますが、バージョンはRHEL8.8同梱版でしょうか?

> こちらを踏まえ、以下ご質問させていただきたく存じます。
> ①Pacemakerがリソースエージェント経由で起動したプロセスに対してシグナル番号13(SIGPIPE)を通知するケースが存在するのか、もし存在する場合はどのようなときに発生するのか

Pacemakerの詳細なソースを確認していませんが、基本的にSIGPIPEを通知するケースはないと思っています。

> ②起動コマンドを手動実行する場合と、Pacemakerを利用して起動する場合の主な差分は何か

Pacemakerのリソースエージェントとして起動する場合、リソースの種類にもよりますが、pacemakerのexecdプロセスから起動されることになります。
Pacemakerのリソースエージェントの種類には、現状、ocf/lsb/systemdが存在しています。

Pacemakerの自作のresource-agentを利用されているとのことですが、ocfリソースでしょうか?それとも、lsbリソースでしょうか?
ocfリソースであれば、RHEL8.8に同梱されているPacemakerに含まれるocfリソースが参考になると思います。

systemdのリソースもPacemakerでは利用可能ですので、MQFXを起動するsystemdリソースがIBM殿から提供されているのであれば、そちらでの起動を試してみると切り分けになるかも知れません。

Pacemakerのログを添付して頂くと、もしかすると、もう少し詳細がわかるかも知れません。

以上です。

> ----- Original Message -----
> 
> From: "ARISA MAKINO" <ARISA****@ibm*****>
> To: "LINUX-HA" <linux****@lists*****>
> Date: 2024/08/21 水 15:17
> Subject: [Linux-ha-jp]  RHEL上でのPacemakerの挙動に関して
> 
> 
> お世話になります。牧野と申します。
> 
> Pacemakerの挙動で困っている箇所があり、有識者の方でご存知の方がいればご教示いただきたいです。
> 詳細は以下に記載します。
> 
> ■環境
>  Red Hat Enterprise Linux 8.8
>  MQ File Transfer Program V5.6.7 (64bit) Trial Version
>  Pacemaker 0.10.12
> 
> ■問合せ内容
> Pacemakerを利用して、IBM製品であるMQとMQFXのHA構成(active-standby)の構成を組み、以下の検証を実施しています。
> MQとMQFXを起動させ、別のサーバーからMQFX-Putを行った際に検証しているサーバー上でファイルを取得(Get)できるかの確認。
> 
> MQFXをコマンドベースで起動(su - mqfx -c "nohup xmqfgetx -m [QMGR] -cq [CTRLキュー] &")した場合には正常にファイル取得が実行されますが、Pacemakerの自作のresource-agent経由で上記と同じコマンドでMQFXのプロセスを起動すると、正常にファイル取得ができないという事象が発生しています。
> こちらについて、解決策を教えていただきたいです。
> 
> 【事象】
> MQFXコマンドを手動実行した場合の挙動
> 1.正常にxmqfgetxプロセスが起動。
> 2.リモートホストからのxmqfputxコマンドによるファイル転送が正常に書き出しされる。
> 
> Pacemakerによって起動した場合の挙動
> 1.正常にxmqfgetxプロセスが起動。
> 2.リモートホストからのxmqfputxコマンドにより、ローカルのCTRLキューとDATAキューにメッセージが格納される。
> その間、xmqfgetxプロセスは起動しているが、キューからメッセージを取得並びにファイル書き出しは実行されない。
> 3.1分程度を目安にxmqfgetxプロセスが異常終了し、同時に下記エラーメッセージが/var/mqm/qmgrs/[QMGR]/errors/mqfx.log.01に出力される。
> OMQ5034E Data get process abnormally terminated. ( 0000000D )
> 4.pacemakerがxmqfxgetxのプロセス停止を検知し、Pacemakerにより組み込まれたコマンドにより再起動する。
> 5.再起動と同時にローカルのCTRLキューとDATAキューからファイルへの書き出しが実施される。
> 6.以降、リモートホストからのPutがある度に、2.~5.を繰り返す。
> 
> 上記件に関する解決策や調査方法等を教えていただきたく、お問い合わせさせていただきました。
> MQFXのサポートに問い合わせたところ、OMQ5034EエラーメッセージはMQFXの外部から通知されたシグナル(シグナル番号13(SIGPIPE))をデータ受信プロセスが受信して異常終了したことを表しているとのことでした。
> またMQFXのデータ送受信プロセスにSIGPIPEが渡されるような処理は存在しないため、プロセスにシグナルを通知するような処理がPacemakerまわりに含まれていないか確認してほしいとの旨ご回答いただきました。
> 
> こちらを踏まえ、以下ご質問させていただきたく存じます。
> ①Pacemakerがリソースエージェント経由で起動したプロセスに対してシグナル番号13(SIGPIPE)を通知するケースが存在するのか、もし存在する場合はどのようなときに発生するのか
> ②起動コマンドを手動実行する場合と、Pacemakerを利用して起動する場合の主な差分は何か
> 
> お忙しいところ恐縮ですが、ご回答の程何卒宜しくお願い致します。
> 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> https://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 



Linux-ha-japan メーリングリストの案内
Back to archive index