[Linux-ha-jp] 返: CentOS7.6とPG-REX9.6の設定について

Back to archive index
T.Shioya t-shi****@lsi-j*****
2019年 6月 7日 (金) 17:09:18 JST


最近MLに参加させていただきました、塩屋と申します。

私の環境でも
○ CentOS7.6.1810
○ pacemaker-repo-1.1.19-1.1.el7.x86_64.rpm
の組み合わせて、
systemctrl restart network
だけで再起動してしまう現象に陥り、MLの過去ログを見て

corosync の watchdog の timeout を調べると
デフォルトで6秒になっており

/etc/corosync.corosync.conf の末尾に

resources {
    watchdog_timeout:  60
}

を追加し、60秒にすることで回避できました。

違う原因であれば申し訳ありませんが
一度試してみてはいかがでしょうか。

以上、よろしくお願いします。



>To:松島様
>
>海藤です。
>いつもお世話になっております。
>
>>おそらくSoftdog周りだと思いますが、systemdのcorosync.service
>> (/etc/systemd/system/corosync.service) の設定はどの様になっていますでしょうか?
>
>corosync.serviceは下記の設定となってます
>変な設定はしていないつもりですが・・・。
>================================================================= 
>[Unit]
>Description=Corosync Cluster Engine
>Documentation=man:corosync man:corosync.conf man:corosync_overview
>ConditionKernelCommandLine=!nocluster
>Requires=network-online.target
>After=network-online.target
>
>[Service]
>ExecStart=/usr/share/corosync/corosync start
>ExecStop=/usr/share/corosync/corosync stop
>Type=forking
>
># The following config is for corosync with enabled watchdog service.
>#
>#  When corosync watchdog service is being enabled and using with
>#  pacemaker.service, and if you want to exert the watchdog when a
>#  corosync process is terminated abnormally,
>#  uncomment the line of the following Restart= and RestartSec=.
>Restart=on-failure
>#  Specify a period longer than soft_margin as RestartSec.
>RestartSec=70
>#  rewrite according to environment.
>ExecStartPre=/sbin/modprobe softdog
>
>[Install]
>WantedBy=multi-user.target
>=================================================================
>
>>また、一度そのファイルの
>>ExecStartPre=/sbin/modprobe softdog
>>をコメントアウトしてみて動きが変わるかどうか、お試しいただけますでしょうか?
>
>コメントアウトしても再起動するという症状は変りませんでした。
>
>なお、インストール作業の最初に下記を実施していますが問題でしょうか?
># yum install -y NetworkManager-config-server
># systemctl restart NetworkManager
>
>NetworkManagerを使わないという選択肢もあると思いますが、
>それはNetworkManagerを使ってはどうにもならない場合の
>手段と考えてます。
>勿論、NetworkManagerなしの動作確認も準備中です。
>
>他に確認すべきところがありましたらアドバイスお願いします。
>
>以上です。
>
>-----Original Message-----
>From: Linux-ha-japan [mailto:linux****@lists*****] On Behalf Of Takehiro Matsushima
>Sent: Friday, June 7, 2019 12:08 AM
>To: linux****@lists*****
>Subject: Re: [Linux-ha-jp] CentOS7.6とPG-REX9.6の設定について
>
>海藤さん
>
>松島と申します。
>おそらくSoftdog周りだと思いますが、systemdのcorosync.service
>(/etc/systemd/system/corosync.service) の設定はどの様になっていますでしょうか?
>
>また、一度そのファイルの
>ExecStartPre=/sbin/modprobe softdog
>をコメントアウトしてみて動きが変わるかどうか、お試しいただけますでしょうか?
>
>松島
>
>2019年6月5日(水) 20:21 <kaido****@jp*****>:
>>
>> お世話になります。
>> 海藤と申します。
>>
>> 表記の件について、ご相談となります。
>> PostgreSQL9.6をレプリケーションで二重化したくVM上で
>> PG-REX9.6のインストール手順等を確認しております。
>> 一通り設定した後、master側でPG-REXの起動コマンドを
>> 叩いたところCRMファイルを反映させる所でOSが再起動
>> します。少し切り分けしてみたところ、
>> $sudo systemctl start pacemaker
>> でPacemakerを起動するとOS再起動に至るところまでは
>> 確認できています。
>>
>> Corosyncとpacemakerの設定は今のところ利用マニュアル
>> に書かれている内容のみとしています。
>> 違いがあるとしたら設定してるIPアドレスの値とVMの為
>> NICをブリッジ設定したものを指定しているくらいです。
>>
>> CentOSに不慣れなせいもありますが、OSが再起動してしまう
>> ため原因の追究がままならい状態です。
>>
>> Linux KVM上のVMで試してもVirtualBox上のVMで試しても
>> 症状は同じためCentOS+Corosync+Pacemakerで発生している
>> 模様です。
>>
>> 類似の事例に対処された方はおりましたらアドバイスを
>> 頂けると幸いです。
>>
>> 〇CentOS7.6.1810
>> 〇pacemaker-repo-1.1.19-1.1.el7.x86_64.rpm
>> 〇pg-rex_operation_tools_script-1.8.3-1.el7.noarch.rpm
>> 〇postgresql96-server-9.6.12-1PGDG.rhel7.x86_64.rpm
>>
>> 以上です。
>>
>> _______________________________________________
>> Linux-ha-japan mailing list
>> Linux****@lists*****
>> https://lists.osdn.me/mailman/listinfo/linux-ha-japan
>_______________________________________________
>Linux-ha-japan mailing list
>Linux****@lists*****
>https://lists.osdn.me/mailman/listinfo/linux-ha-japan
>_______________________________________________
>Linux-ha-japan mailing list
>Linux****@lists*****
>https://lists.osdn.me/mailman/listinfo/linux-ha-japan

------------------------------
エル・エス・アイ ジャパン(株)
技術本部 塩屋徹朗
t-shi****@lsi-j*****
TEL: 03-5809-2061



Linux-ha-japan メーリングリストの案内
Back to archive index