[fess-user 75] Re: クロール中のはずが3時間ほど何も起こらないのですが...

Back to archive index

Masayuki Shibata mshib****@shima*****
2010年 1月 6日 (水) 17:38:10 JST


柴田@亀岡市です。

ウソ書いてしまいました。ちゃんと終わっていないようです。

本件と同種のファイルの場合
2010-01-06 17:23:03,609 [IndexUpdater] DEBUG jp.sf.fess.solr.IndexUpdater - Indexing http://.../filename.log
2010-01-06 17:23:21,375 [http-8080-3] INFO  
org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected
2010-01-06 17:23:31,453 [Thread-22] INFO  jp.sf.fess.helper.WebIndexHelper - [EXEC TIME] crawling 
time: 89219ms

...と、この種のファイルに出会うと「[EXEC TIME] crawling time: xxxxxms」が
出ます。

document cache が 11 に到達する前にクロールを止めてしまっているようで、
その後の...
[EXEC TIME] index update time: xxxxxms
[EXEC TIME] index optimize time: xxxxxms
...が登場せず、クローラープロセスが終了しません。

このファイルですが、1.4 MByte ほどあるテキストファイルです。

Shift-JIS で「半角カナ」が混じっており、ログですので同じ用語が何度も繰
り返し登場している (15,000 行ほどの) というあたりに特徴があります。


>柴田@亀岡市です。
>
>ログ的には正常に終了するようです。
>
>ただクローラープロセスが実行中のまま戻っては来なくなっています
>が...
>
>ここしばらくのテストでは、実行中のものを Tomcat レベルで強制終
>了せざるを得ない状況が続いていましたので、本件のファイルのせい
>かどうかはわかりません。
>
>>菅谷です。
>>
>>情報をありがとうございます。
>>
>>2010-01-06 13:39:41,968 [IndexUpdater] DEBUG
>>jp.sf.fess.solr.IndexUpdater - Indexing
>>http://hostname/svn/pjname/.../.../.../.../.../.../filename.log
>>
>>止まった最後にある、この filename.log はこれだけを
>>クロールしたときには正常に終了するでしょうか?
>>特定のファイルで発生するのかを切り分けたいと
>>考えています。
>>
>>shinsuke
>>
>>2010年1月6日14:11 Masayuki Shibata <mshib****@shima*****>:
>>> 柴田@亀岡市です。
>>>
>>>>#現在 5000件まで行っているので、現象再現するかもう少ししたら
>>>>#結果が出ます。後ほどまたご報告します。
>>>
>>> どうやら再現しています。
>>>
>>> 前回、強制的に Tomcat を終了させたところ、ドキュメント数 5850
>>> まで行っていましたので、その数字は超えたようですが、ログ行の
>>> 時間間隔が開いてきており、似たような状態に見えます。
>>>
>>> 4000 までは速かったのですが、4000 → 5000 には1時間半ほどか
>>> かった (9時ごろクロール開始で 4000 到達 10時半、5000 到達
>>> が11時半) 後、管理画面上 5000 に貼り付いたままです。
>>> #内部的には 5852 に到達。
>>>
>>> ファイル名を伏せた状態のログを添付しておきます。
>>>
>>> ----------
>>> Shibata, Masayuki
>>> Manager, Software Development
>>> Shimadzu Corporation
>>> Analytical Measuring Instruments Division
>>> Research & Development Department
>>> Telephone:  075-823-1441 Japan
>>> Facsimile:  075-823-1365 Japan
>>> E-mail: mshib****@shima*****
>>>
>>> _______________________________________________
>>> Fess-user mailing list
>>> Fess-****@lists*****
>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>>
>>>
>>
>>_______________________________________________
>>Fess-user mailing list
>>Fess-****@lists*****
>>http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>
>----------
>Shibata, Masayuki
>Manager, Software Development
>Shimadzu Corporation
>Analytical Measuring Instruments Division
>Research & Development Department
>Telephone:  075-823-1441 Japan
>Facsimile:  075-823-1365 Japan
>E-mail: mshib****@shima*****

----------
Shibata, Masayuki
Manager, Software Development
Shimadzu Corporation
Analytical Measuring Instruments Division
Research & Development Department
Telephone:  075-823-1441 Japan
Facsimile:  075-823-1365 Japan
E-mail: mshib****@shima*****




Fess-user メーリングリストの案内
Back to archive index