最近MLに参加させていただきました、塩屋と申します。 私の環境でも ○ CentOS7.6.1810 ○ pacemaker-repo-1.1.19-1.1.el7.x86_64.rpm の組み合わせて、 systemctrl restart network だけで再起動してしまう現象に陥り、MLの過去ログを見て corosync の watchdog の timeout を調べると デフォルトで6秒になっており /etc/corosync.corosync.conf の末尾に resources { watchdog_timeout: 60 } を追加し、60秒にすることで回避できました。 違う原因であれば申し訳ありませんが 一度試してみてはいかがでしょうか。 以上、よろしくお願いします。 >To:松島様 > >海藤です。 >いつもお世話になっております。 > >>おそらくSoftdog周りだと思いますが、systemdのcorosync.service >> (/etc/systemd/system/corosync.service) の設定はどの様になっていますでしょうか? > >corosync.serviceは下記の設定となってます >変な設定はしていないつもりですが・・・。 >================================================================= >[Unit] >Description=Corosync Cluster Engine >Documentation=man:corosync man:corosync.conf man:corosync_overview >ConditionKernelCommandLine=!nocluster >Requires=network-online.target >After=network-online.target > >[Service] >ExecStart=/usr/share/corosync/corosync start >ExecStop=/usr/share/corosync/corosync stop >Type=forking > ># The following config is for corosync with enabled watchdog service. ># ># When corosync watchdog service is being enabled and using with ># pacemaker.service, and if you want to exert the watchdog when a ># corosync process is terminated abnormally, ># uncomment the line of the following Restart= and RestartSec=. >Restart=on-failure ># Specify a period longer than soft_margin as RestartSec. >RestartSec=70 ># rewrite according to environment. >ExecStartPre=/sbin/modprobe softdog > >[Install] >WantedBy=multi-user.target >================================================================= > >>また、一度そのファイルの >>ExecStartPre=/sbin/modprobe softdog >>をコメントアウトしてみて動きが変わるかどうか、お試しいただけますでしょうか? > >コメントアウトしても再起動するという症状は変りませんでした。 > >なお、インストール作業の最初に下記を実施していますが問題でしょうか? ># yum install -y NetworkManager-config-server ># systemctl restart NetworkManager > >NetworkManagerを使わないという選択肢もあると思いますが、 >それはNetworkManagerを使ってはどうにもならない場合の >手段と考えてます。 >勿論、NetworkManagerなしの動作確認も準備中です。 > >他に確認すべきところがありましたらアドバイスお願いします。 > >以上です。 > >-----Original Message----- >From: Linux-ha-japan [mailto:linux****@lists*****] On Behalf Of Takehiro Matsushima >Sent: Friday, June 7, 2019 12:08 AM >To: linux****@lists***** >Subject: Re: [Linux-ha-jp] CentOS7.6とPG-REX9.6の設定について > >海藤さん > >松島と申します。 >おそらくSoftdog周りだと思いますが、systemdのcorosync.service >(/etc/systemd/system/corosync.service) の設定はどの様になっていますでしょうか? > >また、一度そのファイルの >ExecStartPre=/sbin/modprobe softdog >をコメントアウトしてみて動きが変わるかどうか、お試しいただけますでしょうか? > >松島 > >2019年6月5日(水) 20:21 <kaido****@jp*****>: >> >> お世話になります。 >> 海藤と申します。 >> >> 表記の件について、ご相談となります。 >> PostgreSQL9.6をレプリケーションで二重化したくVM上で >> PG-REX9.6のインストール手順等を確認しております。 >> 一通り設定した後、master側でPG-REXの起動コマンドを >> 叩いたところCRMファイルを反映させる所でOSが再起動 >> します。少し切り分けしてみたところ、 >> $sudo systemctl start pacemaker >> でPacemakerを起動するとOS再起動に至るところまでは >> 確認できています。 >> >> Corosyncとpacemakerの設定は今のところ利用マニュアル >> に書かれている内容のみとしています。 >> 違いがあるとしたら設定してるIPアドレスの値とVMの為 >> NICをブリッジ設定したものを指定しているくらいです。 >> >> CentOSに不慣れなせいもありますが、OSが再起動してしまう >> ため原因の追究がままならい状態です。 >> >> Linux KVM上のVMで試してもVirtualBox上のVMで試しても >> 症状は同じためCentOS+Corosync+Pacemakerで発生している >> 模様です。 >> >> 類似の事例に対処された方はおりましたらアドバイスを >> 頂けると幸いです。 >> >> 〇CentOS7.6.1810 >> 〇pacemaker-repo-1.1.19-1.1.el7.x86_64.rpm >> 〇pg-rex_operation_tools_script-1.8.3-1.el7.noarch.rpm >> 〇postgresql96-server-9.6.12-1PGDG.rhel7.x86_64.rpm >> >> 以上です。 >> >> _______________________________________________ >> Linux-ha-japan mailing list >> Linux****@lists***** >> https://lists.osdn.me/mailman/listinfo/linux-ha-japan >_______________________________________________ >Linux-ha-japan mailing list >Linux****@lists***** >https://lists.osdn.me/mailman/listinfo/linux-ha-japan >_______________________________________________ >Linux-ha-japan mailing list >Linux****@lists***** >https://lists.osdn.me/mailman/listinfo/linux-ha-japan ------------------------------ エル・エス・アイ ジャパン(株) 技術本部 塩屋徹朗 t-shi****@lsi-j***** TEL: 03-5809-2061