樋口さん こんばんは、山内です。 共有ディスクということですので、両ノードからディスクは見えているとすると、「 1)diskdを共有ディスクに対しても設定して、locacation成約に追加する。 2)migration-thresholdを1など小さい値に設定する。 が考えられると思います。 ※クラウド環境とのことですので、こちらで手元せ確認出来ませんが・・ 再度、現在の最終的な設定ファイルを開示していただけますでしょうか? 以上、宜しくお願いいたします。 ----- Original Message ----- >From: Yuki Higuchi <Yuki.****@ibm*****> >To: renay****@ybb***** >Cc: linux****@lists***** >Date: 2021/1/12, Tue 18:41 >Subject: filesystemのFOに関して > > >山内さん > >毎度お世話になっております、樋口です。 > >PacemakerにおけるリソースのFOの試験を実施している最中なのですが、以下問題が発生してしまい、お力添えをいただきたいです。 > >【事象】 >filesystemの試験として共有ディスクへのLANを不通にした際にFOが起こらない。 > >【実施事項】 >・共有ディスクとしてクラウドサービスのファイルストレージを使用。 > Pacemaker起動時やAct機のreboot等によるFO実施時にはAct機にてmountされることは確認済。 >・Act機において、共有ディスクへの接続に使用しているインターフェイス(eth1)を ifconfig eth1 down コマンドにてダウンを実施。 >・crm_mon -rfAコマンドを実施して確認したところ、以下のようにFAILED hfmn10tと失敗したままFOされない。 > >Online: [ hfmn10t hfmn20t ] >Full list of resources: > Resource Group: grpTrac > vipcheck (ocf::heartbeat:VIPcheck): Started hfmn10t > ipaddr2 (ocf::heartbeat:IPaddr2): Started hfmn10t > filesystem (ocf::heartbeat:Filesystem): FAILED hfmn10t > Clone Set: clnDiskd [prmDiskd] > Started: [ hfmn10t hfmn20t ] > Clone Set: clnPing [prmPing] > Started: [ hfmn10t hfmn20t ] >Node Attributes: >* Node hfmn10t: > + default_ping_set : 100 > + diskcheck_status_internal : normal > + ringnumber_0 : 192.168.d.xx is UP > + ringnumber_1 : 192.168.d.yy is UP >* Node hfmn20t: > + default_ping_set : 100 > + diskcheck_status_internal : normal > + ringnumber_0 : 192.168.d.zz is UP > + ringnumber_1 : 192.168.d.aa is UP >Migration Summary: >* Node hfmn10t: > filesystem: migration-threshold=1000000 fail-count=1 last-failure='Tue Jan 12 18:14:10 2021' >* Node hfmn20t: >Failed Resource Actions: >* filesystem_monitor_10000 on hfmn10t 'unknown error' (1): call=33, status=Timed Out, exitreason='', > last-rc-change='Tue Jan 12 18:14:10 2021', queued=0ms, exec=0ms > >度々の質問になってしまい恐縮ですが、よろしくお願いいたします。 > > >