[Linux-ha-jp] /var/log/heartbeatに出力されるエラーの問合せ

Back to archive index

Tsunehisa Kawamura tsune****@hitac*****
2009年 10月 29日 (木) 08:45:47 JST


赤松 様

川村です。
ご回答有り難うございます。
プログラムまでのご確認していただき有り難うございました。
ご提案の負荷状況について詳細に調査を実施したいと
思います。

以上ご回答有り難うございました。

On Wed, 28 Oct 2009 19:03:50 +0900
赤松 <akama****@oss*****> wrote:

> To:川村様、稲垣様
> 
>  赤松です。
> 
>  同ログの内容は、リソース監視にて子プロセスとして起動されたRAが
> 正常終了した後、子プロセスが停止した事を受けての処理時に出力
> されています。
> 
>  子プロセスが停止したのを受けてから実際に処理を行うまでに
> 係った時間が 1000ms 経過した事を報告しています。
> 
>  つまり、Heartbeat 内の処理遅延を表しています。
> 
>  ではなぜHeartbeat は処理遅延をしたのか、要因の1つとして
> 負荷までいかなくても、何らかの処理がそのノードで実施されたために
> Heartbeat の処理に影響したのではと推察されます。
> 
>  しかし、当メッセージ出力の処理付近のプログラムを確認しましたが
> メッセージが出力された際、その後の処理において、何ら処理分岐等を与える
> ような処理は行っていませんでした。
>  単に当メッセージの出力処理のみ行っています。
> 
>  なので、個人的には全く無視してよい類のメッセージと捉えています。
> 
>  負荷が掛かっていない状況にて、当メッセージが頻繁(*1)に出力される
> 状況であれば、Heartbeat そのものの処理負荷が高いか、Heartbeat 
> や OS 等が不安定な状況にある可能性も考えられるでしょう。
> 
>  Heartbeat の各種設定ファイルや、事象発生時のvmstat やsar 等の
> 実行結果をもとに、原因を分析するのも良いかと思います。
> 
>  逆に、当メッセージが頻繁に出力されていない状況であれば、特に
> 問題視する必要は無いと思います。
> 
>  (*1)頻度の目安は環境等に依存する為、際頻度時の間隔を元に
>    閾値を設定するのが良いかと思います。
>    例えば、リソース監視間隔を10秒とし、60秒以内に何度も出力
>    されているような状況を想定しています。
> 
>  以上です。
> 
> 
> > 赤松 様
> > 
> > 川村です。
> > 早々のご回答有り難うございます。
> > 
> > 設定変更は出来ないことは判りました。
> > 
> > 原因は、負荷以外無いでしょうか?
> > ご回答のURLに有りますように、私のところも
> > エラーが出た時間帯には、負荷がかかっていない状態です。
> > 
> > 以上よろしくお願いします。
> > 
> > On Wed, 28 Oct 2009 15:53:54 +0900
> > 赤松 <akama****@oss*****> wrote:
> > 
> > > To:川村様
> > > 
> > >  はじめまして、赤松と申します。
> > > 
> > >  御質問について、以下の情報が参考になるかと思います。
> > > 
> > >  http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2009-
> > > February/000124.html
> > > 
> > >  以上、宜しくお願い致します。
> > > 
> > > 
> > > > いつもお世話になっております。
> > > > 川村と申します。
> > > > 
> > > > OS Red Hat Enterprise Linux v.5.2 ES(64bit)
> > > >    (Linux 2.6.18)
> > > > heartbeat 2.1.4-1
> > > > 
> > > > お聞きしたい項目
> > > > ・以下のエラーの対策は可能でしょうか?
> > > > ・このエラーの原因を教えて頂きたい。
> > > > 
> > > > Oct 25 00:19:57 rpsv01 lrmd: [10333]: WARN: G_SIG_dispatch: Dispatch 
> > > > function for SIGCHLD was delayed 1000 ms (> 100 ms) before being called 
> > > > (GSource: 0x1c13c398)
> > > > 
> > > > 以上よろしくお願いします。
> > > > 
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux****@lists*****
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > 
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux****@lists*****
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan





Linux-ha-japan メーリングリストの案内
Back to archive index