Masamichi Fukuda - elf-systems
masamichi_fukud****@elf-s*****
2015年 3月 24日 (火) 14:19:07 JST
中平さん、山内さん こんにちは、福田です。 standby_wait_timeについての情報をありがとうございます。 >もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード) >が必ず一致するような運用をされている場合は、standby_ > > wait_time > に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと > 思いますが、そうでない場合は相撃ちが起きる可能性があります。 なるほど、そういった可能性があるのですね。 今のところ、現用機とDCノードは一致させるようにしたいとは思っています。 >standby_wait_ > > timeをデフォルト値より短く設定する場合は、 > 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が > 生き残ることがないことを確認してから、設定を採用するように > して下さい。 わかりました。 切替試験の際には、上記のことを念頭にやってみます。 宜しくお願いします。 以上 2015年3月24日 13:52 NAKAHIRA Kazutomo <nakahira_kazutomo_b1****@lab*****>: > TO:福田さん > > 中平と申します。横から失礼いたします。 > > standby_wait_timeですが、記述を省略した場合はデフォルト値として > 25秒が設定され、基本的にはデフォルト値のまま使用して頂くことを > 推奨しています。 > > もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード) > が必ず一致するような運用をされている場合は、standby_wait_time > に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと > 思いますが、そうでない場合は相撃ちが起きる可能性があります。 > > これは、現用機が DCノードでない場合、クラスタ間通信の途絶後 > DCノードの役割を引き継いで STONITHを実行するまでの間に数秒 > かかる場合があるためで、状況によっては予備機が先に STONITHを > 実行したり、相撃ちを生じます。 > > standby_wait_timeをデフォルト値より短く設定する場合は、 > 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が > 生き残ることがないことを確認してから、設定を採用するように > して下さい。 > > 以上です。 > > On 2015/03/24 12:21, renay****@ybb***** wrote: > > 福田さん > > > > お疲れ様です。山内です。 > > > > standby_wait_timeを入れて頂いて結構です。 > > たぶん、以前、例として開示したcrmは、あくまで例で、そのあたりは、考慮していなかっただけだと思います。 > > > > 以上です。 > > > > > > > > ----- Original Message ----- > >> From: Masamichi Fukuda - elf-systems <masamichi_fukud****@elf-s*****> > >> To: 山内英生 <renay****@ybb*****>; " > linux****@lists*****" <linux****@lists*****> > >> Date: 2015/3/24, Tue 12:01 > >> Subject: stonithプラグインのパラメータについて > >> > >> > >> 山内さん > >> > >> こんにちは、福田です。 > >> その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。 > >> > >> 済みませんが、stonithプラグインのパラメータについて質問させて下さい。 > >> > >> stonith-helperのパラメータについてです。 > >> > >> 2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。 > >> > 以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。 > >> > >> pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。 > >> > >> こちらでは、今次のようなコンフィグファイルを作っています。 > >> > >> > >> ### Cluster Option ### > >> property \ > >> no-quorum-policy="ignore" \ > >> stonith-enabled="true" \ > >> startup-fencing="false" \ > >> stonith-timeout="710s" \ > >> crmd-transition-delay="2s" > >> > >> ### Resource Default ### > >> rsc_defaults \ > >> resource-stickiness="INFINITY" \ > >> migration-threshold="1" > >> > >> ### Group Configuration ### > >> group HAvarnish \ > >> vip_208 \ > >> varnishd > >> > >> group grpStonith1 \ > >> Stonith1-1 \ > >> Stonith1-2 \ > >> Stonith1-3 > >> > >> group grpStonith2 \ > >> Stonith2-1 \ > >> Stonith2-2 \ > >> Stonith2-3 > >> > >> ### Clone Configuration ### > >> clone clone_ping \ > >> ping > >> > >> ### Fencing Topology ### > >> fencing_topology \ > >> lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \ > >> lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3 > >> > >> ### Primitive Configuration ### > >> primitive vip_208 ocf:heartbeat:IPaddr2 \ > >> params \ > >> ip="192.168.17.208" \ > >> nic="eth0" \ > >> cidr_netmask="24" \ > >> op start interval="0s" timeout="90s" on-fail="restart" \ > >> op monitor interval="5s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="100s" on-fail="fence" > >> > >> primitive varnishd lsb:varnish \ > >> op start interval="0s" timeout="90s" on-fail="restart" \ > >> op monitor interval="10s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="100s" on-fail="fence" > >> > >> primitive ping ocf:pacemaker:ping \ > >> params \ > >> name="default_ping_set" \ > >> host_list="192.168.17.254" \ > >> multiplier="100" \ > >> dampen="1" \ > >> op start interval="0s" timeout="90s" on-fail="restart" \ > >> op monitor interval="10s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="100s" on-fail="fence" > >> > >> > >> primitive Stonith1-2 stonith:external/xen0 \ > >> params \ > >> pcmk_reboot_timeout="60s" \ > >> hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \ > >> dom0="xen0.beta.com" \ > >> op start interval="0s" timeout="60s" on-fail="restart" \ > >> op monitor interval="3600s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="60s" on-fail="ignore" > >> > >> primitive Stonith1-3 stonith:meatware \ > >> params \ > >> pcmk_reboot_timeout="600s" \ > >> hostlist="lbv1.beta.com" \ > >> op start interval="0s" timeout="60s" \ > >> op monitor interval="3600s" timeout="60s" \ > >> op stop interval="0s" timeout="60s" > >> > >> primitive Stonith2-1 stonith:external/stonith-helper \ > >> params \ > >> pcmk_reboot_retries="1" \ > >> pcmk_reboot_timeout="40s" \ > >> hostlist="lbv2.beta.com" \ > >> dead_check_target="192.168.17.133 10.0.17.133" \ > >> standby_wait_time="10" \ > >> standby_check_command="/usr/local/sbin/crm_resource -r > varnishd -W | grep -q `hostname`" \ > >> run_online_check="yes" \ > >> op start interval="0s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="60s" on-fail="ignore" > >> > >> primitive Stonith2-2 stonith:external/xen0 \ > >> params \ > >> pcmk_reboot_timeout="60s" \ > >> hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \ > >> dom0="xen0.beta.com" \ > >> op start interval="0s" timeout="60s" on-fail="restart" \ > >> op monitor interval="3600s" timeout="60s" on-fail="restart" \ > >> op stop interval="0s" timeout="60s" on-fail="ignore" > >> > >> primitive Stonith2-3 stonith:meatware \ > >> params \ > >> pcmk_reboot_timeout="600s" \ > >> hostlist="lbv2.beta.com" \ > >> op start interval="0s" timeout="60s" \ > >> op monitor interval="3600s" timeout="60s" \ > >> op stop interval="0s" timeout="60s" > >> > >> ### Resource Location ### > >> location HA_location-1 HAvarnish \ > >> rule 200: #uname eq lbv1.beta.com \ > >> rule 100: #uname eq lbv2.beta.com > >> > >> location HA_location-2 HAvarnish \ > >> rule -INFINITY: not_defined default_ping_set or default_ping_set > lt 100 > >> > >> location HA_location-3 grpStonith1 \ > >> rule -INFINITY: #uname eq lbv1.beta.com > >> > >> location HA_location-4 grpStonith2 \ > >> rule -INFINITY: #uname eq lbv2.beta.com > >> > >> 宜しくお願いします。 > >> > >> 以上 > >> > >> > >> > >> > >> 2015年3月20日 17:16 <renay****@ybb*****>: > >> > >> 福田さん > >>> > >>> > >>> お疲れ様です。山内です。 > >>> > >>>> > こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。 > >>> > >>> この時ですが、戻したりする前に、 > >>> 1)使っていたバージョンのソースディレクトリで、make uninstall > >>> 2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除 > >>> しておいた方がよいです。 > >>> > >>>> そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。 > >>>> あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。 > >>> > >>> > >>> そうでしたか・・・・良かったですね。 > >>> といっても、build:e32080bが動かないと問題ですが・・・・ > >>> > >>> また、週末に時間が取れたら、こちらでもやってみます。 > >>> 進展があれば、ご連絡いたします。 > >>> > >>> 以上です。 > >>> > >>> > >>> > >>> > >> -- > >> > >> ELF Systems > >> Masamichi Fukuda > >> mail to: masamichi_fukud****@elf-s***** > >> > >> > > > > _______________________________________________ > > Linux-ha-japan mailing list > > Linux****@lists***** > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > > > > > > > > > -- > NTT オープンソースソフトウェアセンタ > 中平 和友 > TEL: 03-5860-5135 FAX: 03-5463-6490 > Mail: nakahira_kazutomo_b1****@lab***** > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan > > -- ELF Systems Masamichi Fukuda mail to: *masamichi_fukud****@elf-s***** <elfsy****@gmail*****>* -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Download