Takahiro Matsumoto
matsu****@gmail*****
2008年 8月 19日 (火) 19:12:45 JST
すっかりお世話になってます。 松本です。 > brctl show の結果等を見せて頂ければわかるかとも思いますが、ひょっとする > とDomUはデフォルトで作成される virbr0 の仮想ブリッジに接続しているので > しょうか? おっしゃる通り、デフォルトの virbr0 です。 こんな感じになってます。 ---------------------------------------------------------------------- # brctl show bridge name bridge id STP enabled interfaces virbr0 8000.000000000000 yes xenbr0 8000.feffffffffff no vif5.0 vif1.0 peth0 vif0.0 ---------------------------------------------------------------------- 問題となっているのは、vif5.0 です。 ひとまず、ネットワーク関連だけお知らせしておきますと..... >> ちなみに、NGのパターンでは、scpやftpなどのファイル転送では、双方向で通 >> 信スピード等も問題なく通信できているのでしょうか? >> lost packet(s) と出ているのならば、他のプロトコルもまともに通信できてな >> いような気もしますが.. DomU環境のパケット落ちなどについて、今まで未確認だったので確かめてみました。 以下、scpにて1ファイル664MByteを転送した結果です。 リアル → XenDomU : 転送時間 01:25 7.8MB/s (Heartbeat失敗ケース) リアル → VMware/WinXP : 転送時間 01:24 7.9MB/s (Heartbeat成功ケース) パケットレベルでは確認していませんが、問題無いように感じてます。 >> brctl show などで仮想ブリッジの構成と、Dom0,DomUのネットワーク設定を教 >> えてくれませんか? Dom0,DomUのネットワーク設定は ifconfig でいいでしょうか。 > また、one-shotでかまわないので、OK時とNG時の両方のcrm_monの結果も、 > ha.cf等の情報とあわせて教えてください。 了解しました。 別途設定ファイル&ログを送りますのでよろしくお願いします。 2008/08/19 17:27 Takayuki Tanaka <tanak****@oss*****>: > > 再び 田中です。 > > brctl show の結果等を見せて頂ければわかるかとも思いますが、ひょっとする > とDomUはデフォルトで作成される virbr0 の仮想ブリッジに接続しているので > しょうか? > > また、one-shotでかまわないので、OK時とNG時の両方のcrm_monの結果も、 > ha.cf等の情報とあわせて教えてください。 > > > >> 田中 です。 >> >>> 現状分かったのは、 >>> 1.リアル と XenDomU(CentOS4.6) の同期 → NG >>> 2.リアル と XenDomU(CentOS5.2) の同期 → NG >>> 3.リアル と XenDom0 の同期 → NG >>> 4.リアル と VMware/WinXP の同期 → OK >>> 5.XenDom0 と XenDomU(CentOS4.6) → OK >>> 6.XenDom0 と リアル → NG >> >> 5の構成は、同一サーバ上のDom0とDomUでHeartbeatを構成しているって事ですね。 >> 3,6のような XenDom0<->リアル でもNGという事象からすると、Xenの仮想ブ >> リッジ(xenbr0等)を介し外部NWで接続するとNGという事象なんですね。 >> 予想として、XenDom0 と VMware/WinXP の同期 もやってみたらNGかな.. >> >> ちなみに、NGのパターンでは、scpやftpなどのファイル転送では、双方向で通 >> 信スピード等も問題なく通信できているのでしょうか? >> lost packet(s) と出ているのならば、他のプロトコルもまともに通信できてな >> いような気もしますが.. >> >> brctl show などで仮想ブリッジの構成と、Dom0,DomUのネットワーク設定を教 >> えてくれませんか? >> >> また、このMLへ添付はおそらくOKだと思うので、/etc/ha.d/ha.cf の情報もほ >> しいです。 >> >> >> >>> 田中さま >>> >>> 松本です。 >>> 早速の情報ありがとうございます。 >>> >>>> ノード1(リアルサーバ) >>>> - CentOS 5.2 (i386) >>>> - Heartbeat 2.1.3-3.el5 i386 >>>> >>>> ノード2(Xen-ドメインU:準仮想化) >>>> - RHEL 4.6 (x86_64) >>>> - Heartbeat 2.1.3-3.el4 x86_64 (centos4.6の extras x86_64より取得) >>>> >>>> Xen-ドメイン0サーバ >>>> - CentOS 5.2 (x86_64) >>>> - Xen 3.0.3-64.el5_2.1 >>>> >>>> >>>> ノード2は、Xen-ドメイン0サーバ上にあるドメインUで、そのドメインUとリア >>>> ルサーバでHeartbeatを構成させていると考えて間違いないのですよね? >>> そのとおりです。説明が少々足りませんでした。 >>> ドメインU と リアルサーバにて Heartbeat してます。 >>> >>> >>>> 一度両ノードでONLINEは確認できているみたいなので違うかもしれませんが、 >>>> なんか、hostcache等のファイルが悪さをしているようにも思われますねぇ。 >>>> なので一度Heartbeatを停止し、/var/lib/heartbet以下の hb_generation, >>>> hb_uuid, hostcache を削除し、さらには /var/lib/heartbeat/crm/ 以下のファ >>>> イルを削除してからHeartbeatを起動し、もう一度cibadminコマンドでリソース >>>> を追加してみてはいかがでしょうか? >>>> (もう既にやっていたらごめんなさいです..) >>> いえいえとんでもないです。 >>> hb_* のファイルは消していいのか分からずだったので、安心しました。 >>> 消しても大丈夫だったんですね。 >>> >>> ・・・・残念ながらそれでも状況は変わりませんでした。。。 >>> ちなみにこちらの環境は全て32bit環境です。 >>> 確かに同じではないですけど、構成的にはほとんど同じ印象ですよね。 >>> 大きく違うとしたらマシンスペックでしょうか・・・・。 >>> (Xen実行サーバ:Pentium4-2.66GHz, Memory1G) ← 貧弱です >>> >>> >>> その後なのですが、いろいろな組み合わせで試してみました。 >>> サーバ1:リアルサーバ(CentOS5.2) >>> サーバ2:Xen-ドメインU, 準仮想化(CentOS4.6) >>> サーバ3:Xen-ドメインU, 準仮想化(CentOS5.2) >>> サーバ4:Xen-ドメイン0(CentOS5.2) >>> サーバ5:WinXP上のVMwareServerの仮想マシン(CentOS5.2) >>> >>> 現状分かったのは、 >>> 1.リアル と XenDomU(CentOS4.6) の同期 → NG >>> 2.リアル と XenDomU(CentOS5.2) の同期 → NG >>> 3.リアル と XenDom0 の同期 → NG >>> 4.リアル と VMware/WinXP の同期 → OK >>> 5.XenDom0 と XenDomU(CentOS4.6) → OK >>> 6.XenDom0 と リアル → NG >>> >>> という感じでした。 >>> 仮想マシンのリソースの関係で、XenDomUどうしの同期は試せないのですが、 >>> 雰囲気からするとOKな感じがします。 >>> >>> >>> 実は同期に失敗した時のログを見ていたら、 >>> Aug 18 20:01:31 node1 heartbeat: [2743]: WARN: 1 lost packet(s) for >>> [####.####.###.jp] [252:254] >>> のようなログが出力されていたので気になっています。 >>> (node1 と node2 での同期で、node1で cibadminを行なった時に node2 側で出力されます) >>> >>> 近々、シンプルな構成で実行させた時のログを取ろうと思っています。 >>> このMLは添付ファイルしても大丈夫だったですよね? >>> どこかにルール書いてあったらごめんなさいですが。。。 >>> >>> >>>> ちなみに.. >>>> CentOS extrasにあるHeartbeat2.1.3のcrm_monは、デフォルトでone-shotモー >>>> ドになってしまうんですね。個人的にはちょっと使いにくいですなぁ.. >>> そうそう、そうなんです。 >>> 一連の操作にだいぶ慣れてしまったので、less & shit+f でログを眺めて判断してたりします。 >>> 始めてコマンドたたいた時はちょっとショックでした・・・。 >>> >>> >>> ########## T.matsumto >>> >>> > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >