[Linux-ha-jp] filesystemのFOに関して

Back to archive index
renay****@ybb***** renay****@ybb*****
2021年 1月 12日 (火) 23:06:22 JST


樋口さん

こんばんは、山内です。

共有ディスクということですので、両ノードからディスクは見えているとすると、「
1)diskdを共有ディスクに対しても設定して、locacation成約に追加する。
2)migration-thresholdを1など小さい値に設定する。

が考えられると思います。
※クラウド環境とのことですので、こちらで手元せ確認出来ませんが・・

再度、現在の最終的な設定ファイルを開示していただけますでしょうか?

以上、宜しくお願いいたします。



----- Original Message -----
>From: Yuki Higuchi <Yuki.****@ibm*****>
>To: renay****@ybb***** 
>Cc: linux****@lists*****
>Date: 2021/1/12, Tue 18:41
>Subject: filesystemのFOに関して
> 
>
>山内さん
> 
>毎度お世話になっております、樋口です。
> 
>PacemakerにおけるリソースのFOの試験を実施している最中なのですが、以下問題が発生してしまい、お力添えをいただきたいです。
> 
>【事象】
>filesystemの試験として共有ディスクへのLANを不通にした際にFOが起こらない。
> 
>【実施事項】
>・共有ディスクとしてクラウドサービスのファイルストレージを使用。
> Pacemaker起動時やAct機のreboot等によるFO実施時にはAct機にてmountされることは確認済。
>・Act機において、共有ディスクへの接続に使用しているインターフェイス(eth1)を ifconfig eth1 down コマンドにてダウンを実施。
>・crm_mon -rfAコマンドを実施して確認したところ、以下のようにFAILED hfmn10tと失敗したままFOされない。
> 
>Online: [ hfmn10t hfmn20t ]
>Full list of resources:
> Resource Group: grpTrac
>     vipcheck   (ocf::heartbeat:VIPcheck):      Started hfmn10t
>     ipaddr2    (ocf::heartbeat:IPaddr2):       Started hfmn10t
>     filesystem (ocf::heartbeat:Filesystem):    FAILED hfmn10t
> Clone Set: clnDiskd [prmDiskd]
>     Started: [ hfmn10t hfmn20t ]
> Clone Set: clnPing [prmPing]
>     Started: [ hfmn10t hfmn20t ]
>Node Attributes:
>* Node hfmn10t:
>    + default_ping_set                  : 100
>    + diskcheck_status_internal         : normal
>    + ringnumber_0                      : 192.168.d.xx is UP
>    + ringnumber_1                      : 192.168.d.yy is UP
>* Node hfmn20t:
>    + default_ping_set                  : 100
>    + diskcheck_status_internal         : normal
>    + ringnumber_0                      : 192.168.d.zz is UP
>    + ringnumber_1                      : 192.168.d.aa is UP
>Migration Summary:
>* Node hfmn10t:
>   filesystem: migration-threshold=1000000 fail-count=1 last-failure='Tue Jan 12 18:14:10 2021'
>* Node hfmn20t:
>Failed Resource Actions:
>* filesystem_monitor_10000 on hfmn10t 'unknown error' (1): call=33, status=Timed Out, exitreason='',
>    last-rc-change='Tue Jan 12 18:14:10 2021', queued=0ms, exec=0ms 
> 
>度々の質問になってしまい恐縮ですが、よろしくお願いいたします。
>
>
>



Linux-ha-japan メーリングリストの案内
Back to archive index