[Linux-ha-jp] スプリットブレイン時の回復方法

Back to archive index

mlus mlus****@39596*****
2014年 1月 23日 (木) 09:47:25 JST


コヤマです。
高塚さん、松島さん ご丁寧なご返答ありがとうございます。

>スプリットブレインは双方音信不通の状態をいいます。
>HAクラスタにとっての連絡経路はインタコネクトLANのみで、その他のNICは単なるリソースです。

スプリットブレインについて、少々誤解していたようです。
インターコネクト回線がリソース回線をコントロールできなくなった
状態を、スプリットブレインだと思っていたのですが、
インターコネクト回線自体の障害を言うのですね。

上記を踏まえて、host1のインターコネクト回線を引き抜く事で
スプリットブレインを引き起こしてみた所、無事に?両DCが
partition WITHOUT quorum
状態になってくれました。



host1(active)
host2(standby)

0:host1のインターコネクト回線を停止***>
0:host1 --------------------------------
Last change: Thu Jan 23 08:59:22 2014 by hacluster via crmd on host1
Stack: corosync
Current DC: host1 (2130706433) - partition WITHOUT quorum
Version: 1.1.10-1.2-d9bb763
3 Nodes configured
5 Resources configured


Online: [ host1 ]
OFFLINE: [ host2 host1 ]

Full list of resources:

 Resource Group: grp
     v_ip       (ocf::heartbeat:IPaddr2):       Started host1
     failmail   (ocf::heartbeat:MailTo):        Started host1
 Clone Set: clone_v_ping [v_ping]
     Started: [ host1 ]
     Stopped: [ host2 ]

Node Attributes:
* Node host1:
    + pingcheck                         : 100

Migration summary:
* Node host1:
-----------------------------------------------------------

1:host2 ---------------------------------
Last updated: Thu Jan 23 09:07:23 2014
Last change: Thu Jan 23 08:58:57 2014 by hacluster via crmd on host2
Stack: corosync
Current DC: host2 (2886926338) - partition WITHOUT quorum
Version: 1.1.10+git20140110.3e89301-99.3-1.1.10+git20140110.3e89301
2 Nodes configured
4 Resources configured


Online: [ host2 ]
OFFLINE: [ host1 ]

Full list of resources:

 Resource Group: grp
     v_ip    (ocf::heartbeat:IPaddr2):    Started host2
     failmail    (ocf::heartbeat:MailTo):    Started host2
 Clone Set: clone_v_ping [v_ping]
     Started: [ host2 ]
     Stopped: [ host1 ]

Node Attributes:
* Node host2:
    + pingcheck                           : 100

Migration summary:
* Node host2:
-----------------------------------------------------------

1:host1 仮想アドレス確認 ***
# ip addr show
    inet 192.168.1.7/24 brd 192.168.1.255
    inet 192.168.1.90/24 brd 192.168.1.255
------------------------------------------------------------

1:host2 仮想アドレス確認 ***
# ip addr show
    inet 192.168.1.254/24 brd 192.168.1.255
    inet 192.168.1.90/24 brd 192.168.1.255
------------------------------------------------------------
※ 両方のホストで、同じ仮想アドレス192.168.1.90が作成されているのでマズイ!!


私が質問したかったのは、この状態からの復帰方法です。
host1、host2 のHAを停止し、キャッシュを削除した後で、
再度、両ホストのHAを起動すれば同期する事はわかっているのですが、
そうではなくて、

 両ホストのHAはこの状態のまま稼動させたままで、どのように復旧させるか?

が知りたかったのです。

crmのコマンドを使ってどのように復旧させれば良いのか、
ご教授頂ければ幸いです。





Linux-ha-japan メーリングリストの案内
Back to archive index