[Linux-ha-jp] corosyncのインターコネクト回線の質問

Back to archive index

mlus mlus****@39596*****
2014年 1月 16日 (木) 00:26:20 JST


コヤマです。

山内 さん、ご返答ありがとうございます。

> ご指摘の通りcorosync環境(及び、Heartbeatのv2モード以降)では、シリアルポートでのHA通信は利用できません。
>
> インターコネクト回線は専用でも併用でも個人的には回線の負荷状況によりますが、利用可能だと思っています。

やはり、シリアルポート経由ではインターコネクト回線はできないのですね。
LANポート利用でも併用されておられるということなので、私もそうしたいと思います。

corosync-2.3.1
pacemaker-1.1.10

host1                            host2
eth0(192.168.1.7) ---  eth0(192.168.1.254)

===== coronosync.conf ============
totem {
        version: 2
        crypto_cipher: none
        crypto_hash: none
        secauth: off
        interface {
                ringnumber: 0
                bindnetaddr: 192.168.1.0
                mcastaddr: 239.255.1.1
                mcastport: 5405
                ttl: 1
        }
}

logging {
        fileline: off
        to_stderr: no
        to_logfile: yes
        logfile: /var/log/cluster/corosync.log
        to_syslog: yes
        debug: off
        timestamp: on
        logger_subsys {
                subsys: QUORUM
                debug: off
        }
}


quorum {
        provider: corosync_votequorum
        expected_votes: 2
}

====================================

上記構成で試した所、ちょっとしたトラブルに見舞われています。


# corosync-cfgtool -s
Printing ring status.
Local node ID -1062731513
RING ID 0
    id    = 192.168.1.7
    status    = ring 0 active with no faults
duo:/etc/corosync #



# corosync-quorumtool -l

Membership information
----------------------
    Nodeid      Votes Name
3232235783          1 host1.private.com (local)
3232236030          1 host2.private.com
(ホスト名は、書き換えてあります)

# corosync-cmapctl | grep members
runtime.totem.pg.mrp.srp.members.3232235783.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.3232235783.ip (str) = r(0) ip(192.168.1.7)
runtime.totem.pg.mrp.srp.members.3232235783.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.3232235783.status (str) = joined
runtime.totem.pg.mrp.srp.members.3232236030.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.3232236030.ip (str) = r(0) ip(192.168.1.254)
runtime.totem.pg.mrp.srp.members.3232236030.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.3232236030.status (str) = joined

ここで問題なのが、

corosync-cfgtool -s した時の ノードIDは -1062731513 なのに、
corosync-quorumtool -l した時のノードIDが 3232235783 になっていることです。
本家のマニュアルでは、この値は各ホストごとに、同じ値になっていましたが、自分の環境では異なる値が出ている点です。
これが、設定ミスによるものなのか、それともパッケージに問題があるのかが判断できないでおります。


# crm_mon -1
Last updated: Thu Jan 16 00:18:49 2014
Last change: Thu Jan 16 00:11:29 2014 by hacluster via crmd on host1.private.com
Stack: corosync
Current DC: host1.private.com (3232235783) - partition with quorum
Version: 1.1.10-1.2-d9bb763
2 Nodes configured
0 Resources configured

Online: [ host1.private.com host2.private.com ]


crm_mon を見る限り、同期がとれていますし、
crm configure property no-quorum-policy=ignore などのセットアップをActiveで行うと、
ちゃんと、standbyの方で反映されています。


もうひとつの問題は、systemctl stop pacemaker.service や systemctl stop corosync.service
した際に、素直に停止できず、30分〜1時間ほどハングアップしてしまう点です。
これが、systemdによる不具合なのか、pacemakerやcorosyncのパッケージ問題なのかが判断できていません。

もし、ご経験されておられる方がいらっしゃいましたら、情報を頂ければ幸いです。





Linux-ha-japan メーリングリストの案内
Back to archive index