[Linux-ha-jp] xenのドメインU上でcib.xml の同期が出来ない

Back to archive index

Takahiro Matsumoto matsu****@gmail*****
2008年 8月 19日 (火) 19:12:45 JST


すっかりお世話になってます。
松本です。

>  brctl show の結果等を見せて頂ければわかるかとも思いますが、ひょっとする
> とDomUはデフォルトで作成される virbr0 の仮想ブリッジに接続しているので
> しょうか?

おっしゃる通り、デフォルトの virbr0 です。
こんな感じになってます。
----------------------------------------------------------------------
# brctl show
bridge name     bridge id               STP enabled     interfaces
virbr0          8000.000000000000       yes
xenbr0          8000.feffffffffff       no              vif5.0
                                                        vif1.0
                                                        peth0
                                                        vif0.0
----------------------------------------------------------------------

問題となっているのは、vif5.0 です。
ひとまず、ネットワーク関連だけお知らせしておきますと.....

>>  ちなみに、NGのパターンでは、scpやftpなどのファイル転送では、双方向で通
>> 信スピード等も問題なく通信できているのでしょうか?
>>  lost packet(s) と出ているのならば、他のプロトコルもまともに通信できてな
>> いような気もしますが..

DomU環境のパケット落ちなどについて、今まで未確認だったので確かめてみました。
以下、scpにて1ファイル664MByteを転送した結果です。

リアル → XenDomU : 転送時間 01:25 7.8MB/s (Heartbeat失敗ケース)
リアル → VMware/WinXP : 転送時間 01:24 7.9MB/s (Heartbeat成功ケース)

パケットレベルでは確認していませんが、問題無いように感じてます。

>>  brctl show などで仮想ブリッジの構成と、Dom0,DomUのネットワーク設定を教
>> えてくれませんか?

Dom0,DomUのネットワーク設定は ifconfig でいいでしょうか。

>  また、one-shotでかまわないので、OK時とNG時の両方のcrm_monの結果も、
> ha.cf等の情報とあわせて教えてください。

了解しました。
別途設定ファイル&ログを送りますのでよろしくお願いします。



2008/08/19 17:27 Takayuki Tanaka <tanak****@oss*****>:
>
>  再び 田中です。
>
>  brctl show の結果等を見せて頂ければわかるかとも思いますが、ひょっとする
> とDomUはデフォルトで作成される virbr0 の仮想ブリッジに接続しているので
> しょうか?
>
>  また、one-shotでかまわないので、OK時とNG時の両方のcrm_monの結果も、
> ha.cf等の情報とあわせて教えてください。
>
>
>
>>  田中 です。
>>
>>> 現状分かったのは、
>>> 1.リアル と XenDomU(CentOS4.6) の同期 → NG
>>> 2.リアル と XenDomU(CentOS5.2) の同期 → NG
>>> 3.リアル と XenDom0 の同期 → NG
>>> 4.リアル と VMware/WinXP の同期 → OK
>>> 5.XenDom0 と XenDomU(CentOS4.6) → OK
>>> 6.XenDom0 と リアル → NG
>>
>>  5の構成は、同一サーバ上のDom0とDomUでHeartbeatを構成しているって事ですね。
>>  3,6のような XenDom0<->リアル でもNGという事象からすると、Xenの仮想ブ
>> リッジ(xenbr0等)を介し外部NWで接続するとNGという事象なんですね。
>>  予想として、XenDom0 と VMware/WinXP の同期 もやってみたらNGかな..
>>
>>  ちなみに、NGのパターンでは、scpやftpなどのファイル転送では、双方向で通
>> 信スピード等も問題なく通信できているのでしょうか?
>>  lost packet(s) と出ているのならば、他のプロトコルもまともに通信できてな
>> いような気もしますが..
>>
>>  brctl show などで仮想ブリッジの構成と、Dom0,DomUのネットワーク設定を教
>> えてくれませんか?
>>
>>  また、このMLへ添付はおそらくOKだと思うので、/etc/ha.d/ha.cf の情報もほ
>> しいです。
>>
>>
>>
>>> 田中さま
>>>
>>> 松本です。
>>> 早速の情報ありがとうございます。
>>>
>>>>  ノード1(リアルサーバ)
>>>>  - CentOS 5.2 (i386)
>>>>  - Heartbeat 2.1.3-3.el5 i386
>>>>
>>>>  ノード2(Xen-ドメインU:準仮想化)
>>>>  - RHEL 4.6 (x86_64)
>>>>  - Heartbeat 2.1.3-3.el4 x86_64 (centos4.6の extras x86_64より取得)
>>>>
>>>>  Xen-ドメイン0サーバ
>>>>  - CentOS 5.2 (x86_64)
>>>>  - Xen 3.0.3-64.el5_2.1
>>>>
>>>>
>>>>  ノード2は、Xen-ドメイン0サーバ上にあるドメインUで、そのドメインUとリア
>>>> ルサーバでHeartbeatを構成させていると考えて間違いないのですよね?
>>> そのとおりです。説明が少々足りませんでした。
>>> ドメインU と リアルサーバにて Heartbeat してます。
>>>
>>>
>>>>  一度両ノードでONLINEは確認できているみたいなので違うかもしれませんが、
>>>> なんか、hostcache等のファイルが悪さをしているようにも思われますねぇ。
>>>>  なので一度Heartbeatを停止し、/var/lib/heartbet以下の hb_generation,
>>>> hb_uuid, hostcache を削除し、さらには /var/lib/heartbeat/crm/ 以下のファ
>>>> イルを削除してからHeartbeatを起動し、もう一度cibadminコマンドでリソース
>>>> を追加してみてはいかがでしょうか?
>>>>  (もう既にやっていたらごめんなさいです..)
>>> いえいえとんでもないです。
>>> hb_* のファイルは消していいのか分からずだったので、安心しました。
>>> 消しても大丈夫だったんですね。
>>>
>>> ・・・・残念ながらそれでも状況は変わりませんでした。。。
>>> ちなみにこちらの環境は全て32bit環境です。
>>> 確かに同じではないですけど、構成的にはほとんど同じ印象ですよね。
>>> 大きく違うとしたらマシンスペックでしょうか・・・・。
>>> (Xen実行サーバ:Pentium4-2.66GHz, Memory1G) ← 貧弱です
>>>
>>>
>>> その後なのですが、いろいろな組み合わせで試してみました。
>>> サーバ1:リアルサーバ(CentOS5.2)
>>> サーバ2:Xen-ドメインU, 準仮想化(CentOS4.6)
>>> サーバ3:Xen-ドメインU, 準仮想化(CentOS5.2)
>>> サーバ4:Xen-ドメイン0(CentOS5.2)
>>> サーバ5:WinXP上のVMwareServerの仮想マシン(CentOS5.2)
>>>
>>> 現状分かったのは、
>>> 1.リアル と XenDomU(CentOS4.6) の同期 → NG
>>> 2.リアル と XenDomU(CentOS5.2) の同期 → NG
>>> 3.リアル と XenDom0 の同期 → NG
>>> 4.リアル と VMware/WinXP の同期 → OK
>>> 5.XenDom0 と XenDomU(CentOS4.6) → OK
>>> 6.XenDom0 と リアル → NG
>>>
>>> という感じでした。
>>> 仮想マシンのリソースの関係で、XenDomUどうしの同期は試せないのですが、
>>> 雰囲気からするとOKな感じがします。
>>>
>>>
>>> 実は同期に失敗した時のログを見ていたら、
>>> Aug 18 20:01:31 node1 heartbeat: [2743]: WARN: 1 lost packet(s) for
>>> [####.####.###.jp] [252:254]
>>> のようなログが出力されていたので気になっています。
>>> (node1 と node2 での同期で、node1で cibadminを行なった時に node2 側で出力されます)
>>>
>>> 近々、シンプルな構成で実行させた時のログを取ろうと思っています。
>>> このMLは添付ファイルしても大丈夫だったですよね?
>>> どこかにルール書いてあったらごめんなさいですが。。。
>>>
>>>
>>>>  ちなみに..
>>>>  CentOS extrasにあるHeartbeat2.1.3のcrm_monは、デフォルトでone-shotモー
>>>> ドになってしまうんですね。個人的にはちょっと使いにくいですなぁ..
>>> そうそう、そうなんです。
>>> 一連の操作にだいぶ慣れてしまったので、less & shit+f でログを眺めて判断してたりします。
>>> 始めてコマンドたたいた時はちょっとショックでした・・・。
>>>
>>>
>>> ########## T.matsumto
>>>
>>>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>





Linux-ha-japan メーリングリストの案内
Back to archive index