[Linux-ha-jp] pacemakerからpostgresqlを起動出来ない件

Back to archive index

海藤 廣一 kaido****@jp*****
2015年 8月 31日 (月) 12:06:39 JST


中平様、松島様

海藤です。
いつもお世話になっております。

Debianでresource-agentsの入れ替えを試みましたところ、
私には他のディストリビューション向けのソースをインストール
して動作させることは出来ませんでした。
代わりにDebianのサイトからダウンロードしてきたもので、
3.9.5をインストールしたところ、postgresqlは起動するように
なったものの、期待している動作とはかなり異なります。

片側しか起動しなかったり、corosync再起動により両側起動しても
レプリケーション動作はしません。
しかもDBS-PRI側が起動しなかった際はvip-naster/slave/repが全て
stoppedのままです。
DBS-PRI側が起動した場合は全てvip-naster/slave/repはDBS-PRI側
として起動してます。

なお、その際のDBS-PRI側のpgdataのフォルダーには必ずrecovery.conf
が一度生成され、その後recovery.doneになっています。
recovery.doneの中身を確認した所、application_name=dbs-priと
なっていますので、レプリケーション動作は出来ずpromoteするしか
なくなっていると思いますが私の解釈は間違っているでしょうか?

添付したcrm_monファイルは何度かcorosyncをリスタートして両Node
でpostgresqlが起動した状態です。

resource-agents以外にも更新しないと正常動作しないものが
あるのでしょうか?

アドバイス等ご協力頂けると助かります。


On Thu, 27 Aug 2015 17:45:46 +0900
海藤 廣一 <kaido****@jp*****> wrote:

> 中平様、松島様
> 
> 海藤です。
> いつもお世話になっております。
> 
> > また、PG_VERSION が読み込めない問題については、initdbで
> > DBを作成したディレクトリが /var/lib/pgostgresql/9.1/main/
> 
> ここのパス指定が間違っていたことに気付いて修正したのですが、
> それでもエラーメッセージが変わっただけでPostgreSQLを起動できない
> 状況に変化が無いので困ってました。
> 
> resource-agentsを3.9.6以降へバージョンアップをチャレンジ
> して見ます。
> 
> 
> 
> On Thu, 27 Aug 2015 17:37:09 +0900
> NAKAHIRA Kazutomo <nakahira_kazutomo_b1****@lab*****> wrote:
> 
> > TO:海藤さん
> > 
> > 中平と申します。
> > # 横から失礼いたします。
> > 
> > pgsql RAが出力している以下 2つのエラーログについてですが、
> > resource-agentsパッケージで提供されている共通関数が利用
> > できない事を意味しております。
> > 
> > Aug 26 14:25:20 DBS_PRI lrmd: [17045]: info: RA output:
> > (pgsql:0:probe:stderr) /usr/lib/ocf/resource.d//heartbeat/pgsql: 1948:
> > /usr/lib/ocf/resource.d//heartbeat/pgsql: ocf_local_nodename: not found
> > Aug 26 14:25:20 DBS_PRI lrmd: [17045]: info: RA output:
> > (pgsql:0:probe:stderr) /usr/lib/ocf/resource.d//heartbeat/pgsql: 1726:
> > /usr/lib/ocf/resource.d//heartbeat/pgsql: ocf_exit_reason: not found
> > 
> > これらの共通関数は、resource-agents-3.9.6で導入されたものです。
> > 
> > もし 3.9.6より古い resource-agentsを使っている環境で、pgsql RA
> > だけ最新版を入手して使っている場合、上記のエラーが発生します。
> > 
> > 対処策としては、resource-agentsを 3.9.6にアップデートすることに
> > なりますが、debianパッケージについて私はあまり詳しくないため、
> > 最新版の入手方法等は分からないことを、ご容赦下さい。
> > # 元のソースコードは、以下の github上で公開されています。
> >   https://github.com/ClusterLabs/resource-agents
> > 
> > 
> > また、PG_VERSION が読み込めない問題については、initdbで
> > DBを作成したディレクトリが /var/lib/pgostgresql/9.1/main/
> > で合っているのか、SELinux等のセキュリティ機能によって
> > アクセスが阻害されていないのかを、念のため確認して下さい。
> > # 私の手元環境では、PG_VERSIONのパーミッションは 600、
> > # オーナー情報は postgres:postgresで問題なく Pacemaker
> > # (pgsql RA)から参照できます。
> > 
> > 
> > On 2015/08/27 13:28, Takehiro Matsushima wrote:
> > > 海藤さん
> > > 
> > > 松島です。
> > > 
> > > "//"の部分ですが、こちらは問題なく解釈されます。(ls -l /var//log などしていただければ動くのはご理解いただけるかとおもいます)
> > > 問題はpgsql RAのなかでノード名の取得に失敗しているということのようですが、最終的に転んでしまっているのはPG_VERSIONのオープンのところだと思います。
> > > pgsql RAは内部でPostgreSQLのバージョンによって処理を変えるためにバージョンの取得を行っています。
> > > pgsql RAがこのファイルを開けるように調整されてみてはいかがでしょうか。
> > > 
> > > お返事遅くなりまして大変申し訳ございませんでした。
> > > 以上よろしくお願いいたします。
> > > 
> > > ----
> > > Takehiro Matsushima
> > > 
> > > 
> > > 
> > > 2015年8月26日 17:39 海藤 廣一 <kaido****@jp*****>:
> > >> 松島様
> > >>
> > >> 海藤です。
> > >> いつもお世話になっております。
> > >>
> > >> 前回送ったメールに添付したログの下記の行の部分がどうも致命傷みたいです
> > >>
> > >> Aug 26 14:25:20 DBS_PRI lrmd: [17045]: info: RA output:
> > >> (pgsql:0:probe:stderr) /usr/lib/ocf/resource.d//heartbeat/pgsql: 1948:
> > >> /usr/lib/ocf/resource.d//heartbeat/pgsql: ocf_local_nodename: not found
> > >>
> > >> この行はRA:pgsqlを見つけられないという意味ですよね?
> > >> 途中"//"のところがあるあたりでパスが通らなくなっているように思います。
> > >> これは何処かの設定ファイルで修正可能なのでしょうか?
> > >>
> > >> ご協力宜しくお願いします。
> > >>
> > >>
> > >> On Wed, 26 Aug 2015 14:57:31 +0900
> > >> 海藤 廣一 <kaido****@jp*****> wrote:
> > >>
> > >>> 松島様
> > >>>
> > >>> 海藤です。
> > >>> 早速のコメント有難うございます。
> > >>>
> > >>>> 起動できない、という状態についてですが、MasterもSlaveも起動しないということでしょうか。
> > >>> はい。両方とも起動しません。
> > >>>
> > >>> またログですが、PostgreSQLは/etc/init.d/postgresql startで起動した場合は
> > >>> 普通に出力されますが、corosyncをrestartしても全く出力されませんでした。
> > >>>
> > >>> 前回のメールで記載したcrmで、crm_mon -fArを実行したものが下記になります。
> > >>> ついでに下記3点をファイルで添付します。
> > >>> ・参考にしたサンプルにIPアドレスやpostgresql関係のパスだけ変更したcrm
> > >>> ・上記crmで実施した際のcrm_mon -fArを実行したもの
> > >>> ・その状態でcorosyncを再起動して切り出したsyslog
> > >>>
> > >>> 当然自分でもログ解析しますが、どこを修正すれば良いのか
> > >>> アドバイス頂けると助かります。
> > >>> 宜しくお願いします。
> > >>>
> > >>> -----------------------
> > >>> ============
> > >>> Last updated: Wed Aug 26 14:07:37 2015
> > >>> Last change: Mon Aug 24 17:22:27 2015 via crmd on DBS_STB
> > >>> Stack: openais
> > >>> Current DC: DBS_PRI - partition with quorum
> > >>> Version: 1.1.7-ee0730e13d124c3d58f00016c3376a1de5323cff
> > >>> 2 Nodes configured, 2 expected votes
> > >>> 4 Resources configured.
> > >>> ============
> > >>>
> > >>> Online: [ DBS_PRI DBS_STB ]
> > >>>
> > >>> Full list of resources:
> > >>>
> > >>> vip-stb (ocf::heartbeat:IPaddr2):       Started DBS_PRI
> > >>>   Resource Group: master-group
> > >>>       vip-pri    (ocf::heartbeat:IPaddr2):       Stopped
> > >>>   Master/Slave Set: msPostgresql [postgresql]
> > >>>       Stopped: [ postgresql:0 postgresql:1 ]
> > >>>
> > >>> Node Attributes:
> > >>> * Node DBS_PRI:
> > >>>      + master-postgresql:0               : -INFINITY
> > >>> * Node DBS_STB:
> > >>>      + master-postgresql:0               : -INFINITY
> > >>>
> > >>> Migration summary:
> > >>> * Node DBS_PRI:
> > >>>     postgresql:0: migration-threshold=1 fail-count=1000000
> > >>> * Node DBS_STB:
> > >>>     postgresql:0: migration-threshold=1 fail-count=1000000
> > >>>
> > >>> Failed actions:
> > >>>      postgresql:0_start_0 (node=DBS_PRI, call=5, rc=-2, status=Timed Out): unknown exec error
> > >>>      postgresql:0_start_0 (node=DBS_STB, call=5, rc=-2, status=Timed Out): unknown exec error
> > >>> -----------------------
> > >>>
> > >>> On Wed, 26 Aug 2015 02:43:58 +0900
> > >>> Takehiro Matsushima <takeh****@gmail*****> wrote:
> > >>>
> > >>>> 海藤さん
> > >>>>
> > >>>> お世話になります、松島と申します。
> > >>>> 起動できない、という状態についてですが、MasterもSlaveも起動しないということでしょうか。
> > >>>> PostgreSQLやPacemakerのログでどのようなエラーが出ているか、crm_mon
> > >>>> -Afrで状態を表示したときにどのような動きをしているかという情報がありますと解決が早くなるかと思います。
> > >>>>
> > >>>> また、以下のドキュメントと比較してvip-repが無かったり、vip-slaveのlocationルールが足りなかったりしているように見えますが、これらを一度サンプルに合わせてみることもおすすめいたします。
> > >>>> https://github.com/t-matsuo/resource-agents/wiki/PostgreSQL-9.1-%E3%82%B9%E3%83%88%E3%83%AA%E3%83%BC%E3%83%9F%E3%83%B3%E3%82%B0%E3%83%AC%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E5%AF%BE%E5%BF%9C-%E3%83%AA%E3%82%BD%E3%83%BC%E3%82%B9%E3%82%A8%E3%83%BC%E3%82%B8%E3%82%A7%E3%83%B3%E3%83%88#masterslave-2%E5%8F%B0%E6%A7%8B%E6%88%90
> > >>>>
> > >>>> 以上、ご確認ください。
> > >>>>
> > >>>> ----
> > >>>> Takehiro Matsushima
> > >>>> _______________________________________________
> > >>>> Linux-ha-japan mailing list
> > >>>> Linux****@lists*****
> > >>>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> > >>>
> > >>
> > >> _______________________________________________
> > >> Linux-ha-japan mailing list
> > >> Linux****@lists*****
> > >> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux****@lists*****
> > > http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> > > 
> > > 
> > 
> > 
> > -- 
> > NTT オープンソースソフトウェアセンタ
> > 中平 和友
> > TEL: 03-5860-5135 FAX: 03-5463-6490
> > Mail: nakahira_kazutomo_b1****@lab*****
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 
> 
> 
> ===================================================
>  パナソニック システムネットワークス株式会社
>  インフラシステム事業部
>  システムプロダクト部  プロダクト技術課
>  海藤 廣一
>  E-mail:kaido****@jp*****
>  (工技係代表) 外線:050-3686-1872
>  (工技係代表) 内線:7-375-8639
> ===================================================
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan



===================================================
 パナソニック システムネットワークス株式会社
 インフラシステム事業部
 システムプロダクト部  プロダクト技術課
 海藤 廣一
 E-mail:kaido****@jp*****
 (工技係代表) 外線:050-3686-1872
 (工技係代表) 内線:7-375-8639
===================================================
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: recovery.done
型:         application/octet-stream
サイズ:     252 バイト
説明:       無し
Download 
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: sample.crm
型:         application/octet-stream
サイズ:     3539 バイト
説明:       無し
URL:        http://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20150831/0ce7de6a/attachment-0005.obj 
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: syslog.txt
型:         application/octet-stream
サイズ:     107458 バイト
説明:       無し
URL:        http://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20150831/0ce7de6a/attachment-0006.obj 
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: crm_mon
型:         application/octet-stream
サイズ:     1304 バイト
説明:       無し
URL:        http://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20150831/0ce7de6a/attachment-0007.obj 



Linux-ha-japan メーリングリストの案内
Back to archive index