DCノード故障時のlogconvの出力について (Linux-ha-jp) - Linux-HA Japan

池田さん

お世話になります。
飯田です。

> 故障発生時のDCは1号機です。 
> DC故障を伴うフェイルオーバ発生時に 
> logconvに上記のメッセージが出力されるのは仕様でしょうか。
フェイルオーバー失敗となるのは期待される動作ではありません。
期待される動きはフェイルオーバー成功となることです。

私の手元の環境でも頂いた設定を使って似たような構成を取り再現してみましたが、
下記の通りフェイルオーバー成功となりました。
Jun 10 05:42:20 cento7-logconv-2.novalocal    info: Set DC node to cento7-logconv-1.novalocal.
Jun 10 05:42:47 cento7-logconv-2.novalocal warning: Node cento7-logconv-1.novalocal is lost
Jun 10 05:42:47 cento7-logconv-2.novalocal    info: Unset DC node cento7-logconv-1.novalocal.
Jun 10 05:42:47 cento7-logconv-2.novalocal    info: Set DC node to cento7-logconv-2.novalocal.
Jun 10 05:42:48 cento7-logconv-2.novalocal   error: Start to fail-over.
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy01 tries to start.
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy01 started. (rc=0)
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy02 tries to start.
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy02 started. (rc=0)
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy03 tries to start.
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy03 started. (rc=0)
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy01 : Started on cento7-logconv-2novalocal
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: Resource dummy03 : Started on cento7-logconv-2novalocal
Jun 10 05:42:48 cento7-logconv-2.novalocal    info: fail-over succeeded.

再現環境と頂いたha-logを比較したところ、池田さんの環境では下記のようなログが出力されていないようです。
Jun 10 05:42:48 cento7-logconv-2 crmd[2249]:  notice: te_rsc_command: Initiating action 4: start dummy01_start_0 on cento7-logconv-2.novalocal (local)

logconvではこのログを使ってリソースのステータスを管理してますので、
ログの出力がないとフェイルオーバーが成功したと判定できません。

なぜこのログが出力されなかったのかまではわかりませんでした。

以上、ご確認よろしくお願いいたします。

> -----Original Message-----
> From: linux****@lists*****
> [mailto:linux****@lists*****] On Behalf Of
> tsuki****@gmail*****
> Sent: Thursday, June 09, 2016 9:19 AM
> To: linux****@lists*****
> Subject: [Linux-ha-jp] DCノード故障時のlogconvの出力について
> 
> お世話になっております。
> 
> 池田です。
> 
> 
> 
> 下記の環境で2ノードクラスタを構築しています。
> 
> 
> 
> # cat /etc/redhat-release
> 
> Red Hat Enterprise Linux Server release 6.5 (Santiago)
> 
> 
> 
> # rpm -qa | grep pacemaker-all
> 
> pacemaker-all-1.1.12-1.1.el6.noarch
> 
> 
> 
> # rpm -qa | grep pm_logconv-cs
> 
> pm_logconv-cs-2.0-1.el6.noarch
> 
> 
> 
> 
> 
> Dummyリソースが3つ設定されたgroupを1号機で起動させた状態で
> 
> 1号機を停止(パワーオフ)すると、期待通り2号機にフェイルオーバしましたが
> 
> 2号機のlogconvに下記のメッセージが出力されました。
> 
> logconvのメッセージだけを確認すると、フェイルオーバに失敗しているようにみ
> えます。
> 
> 
> 
> Jun 8 19:25:58 acdbv-ha02 warning: Node acdbv-ha01 is lost
> 
> Jun 8 19:25:58 acdbv-ha02    info: Set DC node to acdbv-ha02.
> 
> Jun 8 19:26:00 acdbv-ha02   error: Start to fail-over.
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy01 tries to start.
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy01 started. (rc=0)
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy02 tries to start.
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy02 started. (rc=0)
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy03 tries to start.
> 
> Jun 8 19:26:00 acdbv-ha02    info: Resource dummy03 started. (rc=0)
> 
> Jun 8 19:26:00 acdbv-ha02   error: fail-over failed.
> 
> 
> 
> 故障発生時のDCは1号機です。
> 
> DC故障を伴うフェイルオーバ発生時に
> 
> logconvに上記のメッセージが出力されるのは仕様でしょうか。
> 
> それともlogconvの設定が不足しているためDC故障に対応できていないのでしょう
> か。
> 
> 動作確認に使用したlogconvの設定およびha-logを添付いたします。
> 
> 
> 
> 以上よろしくお願いいたします。
> 
> 
> 
> NTT先端技術
> 
> 池田淳子

Linux-HA Japan Forkpm_logconv-cspm_diskdpm_logconv-hbpm_extrasdocpm_crmgenvm-ctlpm_kvm_tools

[Linux-ha-jp] DCノード故障時のlogconvの出力について

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools