[Linux-ha-jp] リソースグループのフェールオーバ動作について

Back to archive index

岩崎@サード 岩崎@サード
2011年 7月 7日 (木) 13:23:54 JST


 岩崎です

> [事象1]
> 3ノード(gw_04,gw_05,gw_06)構成で、リソースグループが存在するノードで
> /etc/init.d/corosync stopを順に実施したところ、リソースグループが
> 以下の状態a.になりました。状態b.を期待していました。
>
> 状態a.
> ============
> Last updated: Thu Jul  7 09:10:59 2011
> Stack: openais
> Current DC: gw_05 - partition WITHOUT quorum
> Version: 1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3
> 3 Nodes configured, 3 expected votes
> 1 Resources configured.
> ============
>
> Online: [ gw_05 ]
> OFFLINE: [ gw_04 gw_06 ]
>
>  Resource Group: rscgroup
>      mountrsc   (ocf::heartbeat:Filesystem):    Started gw_05
>      lsbrsc     (lsb:lsbrsc):   Stopped
>      viprsc     (ocf::heartbeat:IPaddr2):       Stopped

 この症状について、頂いている情報から見えるものとしては、lsbrscの起動時に問題が生じ、フェイルオーバーするノードが無い単一ノードでの動作なので、そこで起動処理が終了し、それ以降のviprscが起動しないという症状に見えますね。

>
> 質問1
>   前述の手順を実施した場合の正しい仕様を教えて下さい。

 仕様としては、仰る通り状態bになるのが正しいと思います。

> 質問2
>   環境設定の不備の場合は、環境設定方法を教えて下さい。

 不備は頂いている情報では見あたりませんね。

> 質問3
>   既知障害の場合は、回避方法を教えて下さい。

 特にこのような症状での既知の問題は見あたりません。というよりもわからないですね。
 lsbsrcの問題のように見えますので、もう少し調査を進めたほうが良いかもしれません。

> [事象2]
> 添付の設定で、全ノードのPacemakerを停止した状態で、1ノートのみ
> Pacemakerを起動すると、ノードは、Onlineとなりますが、リソース
> グループが開始されません。これは、quorumが獲得できないためだと
> 推測しています。
>
> 質問4
>   [事象2]の手順で、リソースグループを起動する設定があれば教えて下さい。

 通常、リソースグループは開始されるはずです。target-roleや、fail-countやlocationの設定でその起動したノードで起動しない状態になっていないか確認してはいかがでしょうか。
 ありがちなのは、fail-countがmigration-thresholdのしきい値に達している状態で、リソースをcleanupせずにテストして上がらないという事があったり、locationでノードを固定してしまっている時になります。

 location cli-prefer-rscgroup rscgroup \
 	rule $id="cli-prefer-rule-rscgroup" inf: #uname eq gw_06

 これが少し気になります。



-- 
 ----------------------------------------------------------------------
 岩崎  登               (株)サードウェア

 Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
 iwasa****@3ware*****      URL: http://www.3ware.co.jp/
 Phone: 047-496-3341      Fax: 047-496-3370





Linux-ha-japan メーリングリストの案内
Back to archive index