柴田さん おはようございます。山内です。 >> 同様にpgsqlのみのmonitorを停止するという手もあります。 >> ※その他、リソースon-failなどを変更する手もあるかと思いますが、パラメータ >> の変更によっては、pgsqlの停止などが掛かって >> ※しまう為、上記くらいではないでしょうか? > > 貴重な情報ありがとうございます。 > pgsqlのmonitorのみ停止する方向で検討してみます。 宜しくお願いいたします。 何か不明な点ありましたら、ご連絡ください。 >> 私の知る限りでは、Pacemakerには存在しな動作(仕様)ですね。 >> こちらは、意外と意味がある仕様変更かも知れませんので、このようなモードにつ >> いては、コミュニティで少し議論してみたいと思います。 > > やはりPacemakerには存在しない動作なのですね。 > 縮退運転中のプロセス停止は即業務停止につながるため、 > ご検討いただけると幸いです。 承知いたしました。 また、動きなどありましたら、Linux-ha-japanのMLにお知らせしたいと思います。 以上です。 ----- Original Message ----- > From: Mao Shibata <shiba****@ryobi*****> > To: renay****@ybb*****; linux****@lists***** > Cc: > Date: 2020/4/29, Wed 14:26 > Subject: RE: [Linux-ha-jp] Pacemakerの縮退中の監視について > > 山内さん > > お世話になります。柴田です。 > >> 同様にpgsqlのみのmonitorを停止するという手もあります。 >> ※その他、リソースon-failなどを変更する手もあるかと思いますが、パラメータ >> の変更によっては、pgsqlの停止などが掛かって >> ※しまう為、上記くらいではないでしょうか? > > 貴重な情報ありがとうございます。 > pgsqlのmonitorのみ停止する方向で検討してみます。 > >> 私の知る限りでは、Pacemakerには存在しな動作(仕様)ですね。 >> こちらは、意外と意味がある仕様変更かも知れませんので、このようなモードにつ >> いては、コミュニティで少し議論してみたいと思います。 > > やはりPacemakerには存在しない動作なのですね。 > 縮退運転中のプロセス停止は即業務停止につながるため、 > ご検討いただけると幸いです。 > > 以上、よろしくお願いいたします。 > >> -----Original Message----- >> From: renay****@ybb***** <renay****@ybb*****> >> Sent: Wednesday, April 29, 2020 5:41 AM >> To: Mao Shibata <shiba****@ryobi*****>; linux****@lists***** >> Subject: Re: [Linux-ha-jp] Pacemakerの縮退中の監視について >> >> 柴田さん >> >> >> おはようございます。山内です。 >> >> > リソース増強、タイムアウト延長が必要なことは重々承知しており >> > タイムアウトについては想定する高負荷に応じて変更予定になります。 >> >> >> 上記すでに、変更を予定されているということ承知いたしました。 >> >> > しかし、(基本発生してはいけませんが)想定以上の高負荷がもし仮に >> > 縮退運転中に発生してしまった場合、スレーブ側が存在しないにも関わらず、 >> > フェイルオーバーを発生させてしまうこと自体問題であるととらえています。 >> >> >> 確かにMasterが単ノード構成中に故障検知から、停止となるのは厳しいですね。 >> あまりこういったケースに遭遇した事がないのですが、おっしゃる通りと思います。 >> >> > >> > 縮退運転になった場合、監視を抑止するために直ちにメンテナンスモードに >> > 移行すれば停止は避けられると考えているのですが、他に良い方法は >> > ないでしょうか? >> >> おっしゃるとおりで、縮退を検知して、メンテナンスモードに移行するという手も >> あります。 >> 同様にpgsqlのみのmonitorを停止するという手もあります。 >> ※その他、リソースon-failなどを変更する手もあるかと思いますが、パラメータ >> の変更によっては、pgsqlの停止などが掛かって >> ※しまう為、上記くらいではないでしょうか? >> >> > 他のクラスタ製品では縮退運転中であれば異常は検知するものの >> > フェイルオーバーは発生させない仕様になっていたりするのですが、 >> > Pacemakerでも同様の振る舞いはできないものでしょうか? >> >> >> 私の知る限りでは、Pacemakerには存在しな動作(仕様)ですね。 >> こちらは、意外と意味がある仕様変更かも知れませんので、このようなモードにつ >> いては、コミュニティで少し議論してみたいと思います。 >> >> 以上です。 >> >> >> >> ----- Original Message ----- >> > From: Mao Shibata <shiba****@ryobi*****> >> > To: renay****@ybb*****; linux****@lists***** >> > Cc: >> > Date: 2020/4/28, Tue 17:24 >> > Subject: RE: [Linux-ha-jp] Pacemakerの縮退中の監視について >> > >> > 山内さん >> > >> > お世話になります。柴田です。 >> > >> > ご回答ありがとうございます。 >> > >> > リソース増強、タイムアウト延長が必要なことは重々承知しており >> > タイムアウトについては想定する高負荷に応じて変更予定になります。 >> > しかし、(基本発生してはいけませんが)想定以上の高負荷がもし仮に >> > 縮退運転中に発生してしまった場合、スレーブ側が存在しないにも関わらず、 >> > フェイルオーバーを発生させてしまうこと自体問題であるととらえています。 >> > >> > 縮退運転になった場合、監視を抑止するために直ちにメンテナンスモードに >> > 移行すれば停止は避けられると考えているのですが、他に良い方法は >> > ないでしょうか? >> > 他のクラスタ製品では縮退運転中であれば異常は検知するものの >> > フェイルオーバーは発生させない仕様になっていたりするのですが、 >> > Pacemakerでも同様の振る舞いはできないものでしょうか? >> > >> > 重ね重ねの質問で申し訳ございませんが、よろしくお願いいたします。 >> > >> >> -----Original Message----- >> >> From: renay****@ybb***** > <renay****@ybb*****> >> >> Sent: Tuesday, April 28, 2020 3:08 AM >> >> To: linux****@lists***** >> >> Subject: Re: [Linux-ha-jp] Pacemakerの縮退中の監視について >> >> >> >> 柴田さん >> >> >> >> こんばんは、山内です。 >> >> >> >> 縮退運転中に高負荷が発生しているとのことですが、どの程度の高負荷が起 >> きてい >> >> るのか >> >> sarなどで確認をされた方が良いかと思います。 >> >> >> >> もし、仮に想定通りとされている両系運用中と同様の高負荷が、縮退運転中 >> にも起 >> >> きているのであれば、 >> >> やはりCPUなどのリソースが不足していることが要因と思われますので、タ >> イム >> >> アウトなどの延長が必要なのではないでしょうか? >> >> >> >> >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検 >> 知? >> >> >して両系ダウンとなります。 >> >> >> >> >> >> 一度、可能な範囲でログの開示などしていただけると良いかも知れません。 >> >> >> >> 以上です。 >> >> >> >> >> >> >> >> ----- Original Message ----- >> >> >From: Mao Shibata <shiba****@ryobi*****> >> >> >To: linux****@lists***** >> >> >Date: 2020/4/21, Tue 14:53 >> >> >Subject: [Linux-ha-jp] Pacemakerの縮退中の監視について >> >> > >> >> >初めて投稿させていただきます。 >> >> >柴田と申します。 >> >> > >> >> >DBサーバ(PostgreSQLレプリケーション構成)を >> >> >Pacemaker+Corosyncを使用してHAクラスタ構成としています。 >> >> > >> >> >高負荷時にPostgreSQLのリソースエージェントがタイムアウトを検知し >> て >> >> >フェイルオーバが発生します。(max_connectionsは使い切っていない) >> >> >ここまでは想定通りなのですが、フェイルオーバーが発生したあと >> >> >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検 >> 知? >> >> >して両系ダウンとなります。 >> >> >高負荷を考慮してタイムアウト時間を長くするという認識はあるのですが、 >> >> >片系運用中に異常検知してDBプロセスを落とすのは避けたいです。 >> >> > >> >> >回避策などご存じの方がいましたら、ご教授ください。 >> >> >よろしくお願いいたします。 >> >> > >> >> >_______________________________________________ >> >> >Linux-ha-japan mailing list >> >> >Linux****@lists***** >> >> >https://lists.osdn.me/mailman/listinfo/linux-ha-japan >> >> > >> >> > >> >> > >> > >