[Linux-ha-jp] 片側ノードをリブート後の heartbeat 動作について

Back to archive index

renay****@ybb***** renay****@ybb*****
2009年 6月 24日 (水) 12:17:52 JST


峠さん

こんにちは。メイトリックスの山内です。

いえいえ、どういたしまして。。。
吉報をお待ちしております。

#なお、詳細な問題の要因をお求めの場合は、本家のメーリングリストへ投稿してみるのも手だと思います。

以上、よろしくお願いいたします。

--- y-tao****@pb***** wrote:

> 山内様
> 
> 峠です。
> 
> 了解しました。
> 
> 2.1.4へ移行してみようと思います。
> 移行結果は後日ご報告させていただきます。
> 
> 深夜まで確認作業を行っていただいたようで
> 申し訳ありませんでした。
> ご指導いただきありがとうございました。
> 
> 以上です。
> 
> > 峠さん
> > 
> > こんばんは、メイトリックスの山内です。
> > 
> > まったく同じ環境ではありませんが、以下のVM上の2ノードで確認しました。
> > 
> > ・CentOS 4.7 (x64)
> > ・Heartbeat 2.1.3-STABLE(ソースからインストール)
> > 
> > 上記の環境では、いくら、cl_status hb_statusをたたいても、stoppedでしか表示されませんでした。
> > #お使いのrpmと若干、バージョンの違いもあるのかも知れません。
> > 
> >
> ちなみに、2.1.4-STABLE版(ソースからインストール)では、各ノード起動後、片系リブート後のHeartbeat
起
> > 動後もcl_statusでただしく起動が確認できました。
> > 
> > 2.1.3の問題かも知れませんので、ぜひ、2.1.4の環境への移行を考慮していただければと思います。
> > 
> >
> また、2.1.3での問題回避のために、crm_monなど別途コマンドを利用してのオンライン状態を確認して頂くか
、ps
> >
> などで実際の起動プロセスの確認、tcpdumpなどでの通信状態の確認をあわせて利用するような形が必要かと
思
> > います。
> > 
> > 以上、よろしくお願いいたします。
> > 
> > 
> > --- y-tao****@pb***** wrote:
> > 
> >> 山内様
> >> 
> >> 峠です。
> >> コメントありがとうございます。
> >> 
> >> (1)cib.xmlを使用していますのでV2モードだと思います。
> >>  この認識で正しいでしょうか?
> >> 
> >> (2)Heartbeatのchkconfigは
> >>  各ノードとも2〜5をonとしています。
> >> 
> >> (3)initdeadの値は60にしていて、
> >>  試験的に120に変更しても現象は変わりませんでした。
> >> 
> >> ha.cf/cib.xmlの内容は下記の通りです。
> >> 
> >> -ha.cf------------------------
> >> crm on
> >> debugfile /var/log/ha-debug
> >> logfile /var/log/ha-log
> >> deadtime 30
> >> deadping 40
> >> warntime 10
> >> initdead 60
> >> node aaaa001
> >> node aaaa002
> >> udpport 694
> >> ucast bond0 172.16.101.102
> >> ------------------------------
> >> 
> >> -cib.xml----------------------
> >>  <cib generated="false" admin_epoch="0" have_quorum="false" ignore_dtd="false" num_peers="2"
> >> cib_feature_revision="2.0" epoch="5" num_updates="2" cib-last-written="Tue Jun 23 13:45:55
> >> 2009">
> >>    <configuration>
> >>      <crm_config>
> >>        <cluster_property_set id="cib-bootstrap-options">
> >>          <attributes>
> >>            <nvpair id="failback" name="default_resource_stickiness" value="INFINITY"/>
> >>            <nvpair id="cib-bootstrap-options-dc-version" name="dc-version" value="2.1.3-node:
> >> 5523・・・省略・・・26a3"/>
> >>          </attributes>
> >>        </cluster_property_set>
> >>      </crm_config>
> >>      <nodes>
> >>        <node id="08c8・・・省略・・・2b37" uname="aaaa002" type="normal"/>
> >>        <node id="c19f・・・省略・・・bcf1" uname="aaaa001" type="normal"/>
> >>      </nodes>
> >>      <resources>
> >>        <group id="grpTest">
> >>          <primitive id="prmIpTest" class="ocf" type="IPaddr" provider="heartbeat">
> >>            <instance_attributes id="atrIpTest">
> >>              <attributes>
> >>                <nvpair id="ipTest" name="ip" value="172.16.101.103"/>
> >>                <nvpair id="maskTest" name="netmask" value="24"/>
> >>                <nvpair id="nicTest" name="nic" value="bond0"/>
> >>              </attributes>
> >>            </instance_attributes>
> >>          </primitive>
> >>          <primitive id="prmAAAAA" class="ocf" type="aaaaa-check" provider="heartbeat">
> >>            <instance_attributes id="atrAAAAA">
> >>              <attributes/>
> >>            </instance_attributes>
> >>            <operations>
> >>              <op id="opAAAAA" name="monitor" interval="60s" timeout="30s"/>
> >>            </operations>
> >>          </primitive>
> >>        </group>
> >>      </resources>
> >>      <constraints/>
> >>    </configuration>
> >>  </cib>
> >> ------------------------------
> >> 
> >> 以上、よろしくお願いします。
> >> 
> >> > 峠さん
> >> > 
> >> > こんにちは、メイトリックスの山内です。
> >> > 
> >> > 下記のHeartbeat環境ですが、V1モードでご利用でしょうか?それともV2モードでご利用でしょうか?
> >> > また、各ノードのHeartbeatのchkconfigなどはどうなっておりますでしょうか?
> >> > 
> >> > 感覚的には、initdead設定あたりが短いのではないかと思いますが、如何でしょうか?
> >> > 
> >> > #出来れば、お見せいただける範囲で、ha.cfや、cib.xmlなどを添付していただけると助かります。
> >> > 
> >> > 以上、よろしくお願いいたします。
> >> > 
> >> >>お世話になっております。
> >> >>峠 と申します。
> >> >>
> >> >>Heartbeatの下記現象について、
> >> >>経験・知識などをお持ちの方がいましたら
> >> >>ご指導いただきたいと思います。
> >> >>
> >> >>
> >> >>・環境
> >> >> CentOS4.6
> >> >> Heartbeat 2.1.3-3.el4.centos
> >> >> ノード2台構成
> >> >>
> >> >>・現象
> >> >> 片側ノード(マシン)をリブートすると
> >> >> そのリブートしたノードはofflineのままとなり、
> >> >> offlineのノードの状態をcl_statusで見てみると
> >> >> 「heartbeat stop on this machine」となっています。
> >> >>
> >> >> この後、両ノードを
> >> >> 「リブートするか、heartbeatをstop/startする」
> >> >> ことによりonlineに戻ります。
> >> >>
> >> >> この現象(offlineのままになる)は、
> >> >> 片側ノードをリブートした場合だけで発生し、
> >> >> 片側ノードのHeartbeatをstop/startしても
> >> >> 両ノードをリブートしても発生しません。(onlineになります。)
> >> >>
> >> >>
> >> >>以上、よろしくお願いします。
> >> > 
> >> > _______________________________________________
> >> > Linux-ha-japan mailing list
> >> > Linux****@lists*****
> >> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >> 
> >> --------------------------------------------------
> >> NECエンジニアリング
> >> MB(事)ソフトウェア部
> >> 峠 裕一郎
> >> 
> >> _______________________________________________
> >> Linux-ha-japan mailing list
> >> Linux****@lists*****
> >> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >> 
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 
> --------------------------------------------------
> NECエンジニアリング
> MB(事)ソフトウェア部
> 峠 裕一郎
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 





Linux-ha-japan メーリングリストの案内
Back to archive index