柴田さん こんばんは、山内です。 縮退運転中に高負荷が発生しているとのことですが、どの程度の高負荷が起きているのか sarなどで確認をされた方が良いかと思います。 もし、仮に想定通りとされている両系運用中と同様の高負荷が、縮退運転中にも起きているのであれば、 やはりCPUなどのリソースが不足していることが要因と思われますので、タイムアウトなどの延長が必要なのではないでしょうか? >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検知? >して両系ダウンとなります。 一度、可能な範囲でログの開示などしていただけると良いかも知れません。 以上です。 ----- Original Message ----- >From: Mao Shibata <shiba****@ryobi*****> >To: linux****@lists***** >Date: 2020/4/21, Tue 14:53 >Subject: [Linux-ha-jp] Pacemakerの縮退中の監視について > >初めて投稿させていただきます。 >柴田と申します。 > >DBサーバ(PostgreSQLレプリケーション構成)を >Pacemaker+Corosyncを使用してHAクラスタ構成としています。 > >高負荷時にPostgreSQLのリソースエージェントがタイムアウトを検知して >フェイルオーバが発生します。(max_connectionsは使い切っていない) >ここまでは想定通りなのですが、フェイルオーバーが発生したあと >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検知? >して両系ダウンとなります。 >高負荷を考慮してタイムアウト時間を長くするという認識はあるのですが、 >片系運用中に異常検知してDBプロセスを落とすのは避けたいです。 > >回避策などご存じの方がいましたら、ご教授ください。 >よろしくお願いいたします。 > >_______________________________________________ >Linux-ha-japan mailing list >Linux****@lists***** >https://lists.osdn.me/mailman/listinfo/linux-ha-japan > > >