飯田 雄介
iiday****@intel*****
2016年 6月 10日 (金) 16:04:04 JST
池田さん お世話になります。 飯田です。 > 故障発生時のDCは1号機です。 > DC故障を伴うフェイルオーバ発生時に > logconvに上記のメッセージが出力されるのは仕様でしょうか。 フェイルオーバー失敗となるのは期待される動作ではありません。 期待される動きはフェイルオーバー成功となることです。 私の手元の環境でも頂いた設定を使って似たような構成を取り再現してみましたが、 下記の通りフェイルオーバー成功となりました。 Jun 10 05:42:20 cento7-logconv-2.novalocal info: Set DC node to cento7-logconv-1.novalocal. Jun 10 05:42:47 cento7-logconv-2.novalocal warning: Node cento7-logconv-1.novalocal is lost Jun 10 05:42:47 cento7-logconv-2.novalocal info: Unset DC node cento7-logconv-1.novalocal. Jun 10 05:42:47 cento7-logconv-2.novalocal info: Set DC node to cento7-logconv-2.novalocal. Jun 10 05:42:48 cento7-logconv-2.novalocal error: Start to fail-over. Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy01 tries to start. Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy01 started. (rc=0) Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy02 tries to start. Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy02 started. (rc=0) Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy03 tries to start. Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy03 started. (rc=0) Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy01 : Started on cento7-logconv-2novalocal Jun 10 05:42:48 cento7-logconv-2.novalocal info: Resource dummy03 : Started on cento7-logconv-2novalocal Jun 10 05:42:48 cento7-logconv-2.novalocal info: fail-over succeeded. 再現環境と頂いたha-logを比較したところ、池田さんの環境では下記のようなログが出力されていないようです。 Jun 10 05:42:48 cento7-logconv-2 crmd[2249]: notice: te_rsc_command: Initiating action 4: start dummy01_start_0 on cento7-logconv-2.novalocal (local) logconvではこのログを使ってリソースのステータスを管理してますので、 ログの出力がないとフェイルオーバーが成功したと判定できません。 なぜこのログが出力されなかったのかまではわかりませんでした。 以上、ご確認よろしくお願いいたします。 > -----Original Message----- > From: linux****@lists***** > [mailto:linux****@lists*****] On Behalf Of > tsuki****@gmail***** > Sent: Thursday, June 09, 2016 9:19 AM > To: linux****@lists***** > Subject: [Linux-ha-jp] DCノード故障時のlogconvの出力について > > お世話になっております。 > > 池田です。 > > > > 下記の環境で2ノードクラスタを構築しています。 > > > > # cat /etc/redhat-release > > Red Hat Enterprise Linux Server release 6.5 (Santiago) > > > > # rpm -qa | grep pacemaker-all > > pacemaker-all-1.1.12-1.1.el6.noarch > > > > # rpm -qa | grep pm_logconv-cs > > pm_logconv-cs-2.0-1.el6.noarch > > > > > > Dummyリソースが3つ設定されたgroupを1号機で起動させた状態で > > 1号機を停止(パワーオフ)すると、期待通り2号機にフェイルオーバしましたが > > 2号機のlogconvに下記のメッセージが出力されました。 > > logconvのメッセージだけを確認すると、フェイルオーバに失敗しているようにみ > えます。 > > > > Jun 8 19:25:58 acdbv-ha02 warning: Node acdbv-ha01 is lost > > Jun 8 19:25:58 acdbv-ha02 info: Set DC node to acdbv-ha02. > > Jun 8 19:26:00 acdbv-ha02 error: Start to fail-over. > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy01 tries to start. > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy01 started. (rc=0) > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy02 tries to start. > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy02 started. (rc=0) > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy03 tries to start. > > Jun 8 19:26:00 acdbv-ha02 info: Resource dummy03 started. (rc=0) > > Jun 8 19:26:00 acdbv-ha02 error: fail-over failed. > > > > 故障発生時のDCは1号機です。 > > DC故障を伴うフェイルオーバ発生時に > > logconvに上記のメッセージが出力されるのは仕様でしょうか。 > > それともlogconvの設定が不足しているためDC故障に対応できていないのでしょう > か。 > > 動作確認に使用したlogconvの設定およびha-logを添付いたします。 > > > > 以上よろしくお願いいたします。 > > > > NTT先端技術 > > 池田淳子