Masayuki Shibata
mshib****@shima*****
2010年 1月 6日 (水) 17:38:10 JST
柴田@亀岡市です。 ウソ書いてしまいました。ちゃんと終わっていないようです。 本件と同種のファイルの場合 2010-01-06 17:23:03,609 [IndexUpdater] DEBUG jp.sf.fess.solr.IndexUpdater - Indexing http://.../filename.log 2010-01-06 17:23:21,375 [http-8080-3] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-06 17:23:31,453 [Thread-22] INFO jp.sf.fess.helper.WebIndexHelper - [EXEC TIME] crawling time: 89219ms ...と、この種のファイルに出会うと「[EXEC TIME] crawling time: xxxxxms」が 出ます。 document cache が 11 に到達する前にクロールを止めてしまっているようで、 その後の... [EXEC TIME] index update time: xxxxxms [EXEC TIME] index optimize time: xxxxxms ...が登場せず、クローラープロセスが終了しません。 このファイルですが、1.4 MByte ほどあるテキストファイルです。 Shift-JIS で「半角カナ」が混じっており、ログですので同じ用語が何度も繰 り返し登場している (15,000 行ほどの) というあたりに特徴があります。 >柴田@亀岡市です。 > >ログ的には正常に終了するようです。 > >ただクローラープロセスが実行中のまま戻っては来なくなっています >が... > >ここしばらくのテストでは、実行中のものを Tomcat レベルで強制終 >了せざるを得ない状況が続いていましたので、本件のファイルのせい >かどうかはわかりません。 > >>菅谷です。 >> >>情報をありがとうございます。 >> >>2010-01-06 13:39:41,968 [IndexUpdater] DEBUG >>jp.sf.fess.solr.IndexUpdater - Indexing >>http://hostname/svn/pjname/.../.../.../.../.../.../filename.log >> >>止まった最後にある、この filename.log はこれだけを >>クロールしたときには正常に終了するでしょうか? >>特定のファイルで発生するのかを切り分けたいと >>考えています。 >> >>shinsuke >> >>2010年1月6日14:11 Masayuki Shibata <mshib****@shima*****>: >>> 柴田@亀岡市です。 >>> >>>>#現在 5000件まで行っているので、現象再現するかもう少ししたら >>>>#結果が出ます。後ほどまたご報告します。 >>> >>> どうやら再現しています。 >>> >>> 前回、強制的に Tomcat を終了させたところ、ドキュメント数 5850 >>> まで行っていましたので、その数字は超えたようですが、ログ行の >>> 時間間隔が開いてきており、似たような状態に見えます。 >>> >>> 4000 までは速かったのですが、4000 → 5000 には1時間半ほどか >>> かった (9時ごろクロール開始で 4000 到達 10時半、5000 到達 >>> が11時半) 後、管理画面上 5000 に貼り付いたままです。 >>> #内部的には 5852 に到達。 >>> >>> ファイル名を伏せた状態のログを添付しておきます。 >>> >>> ---------- >>> Shibata, Masayuki >>> Manager, Software Development >>> Shimadzu Corporation >>> Analytical Measuring Instruments Division >>> Research & Development Department >>> Telephone: 075-823-1441 Japan >>> Facsimile: 075-823-1365 Japan >>> E-mail: mshib****@shima***** >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-****@lists***** >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-****@lists***** >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >---------- >Shibata, Masayuki >Manager, Software Development >Shimadzu Corporation >Analytical Measuring Instruments Division >Research & Development Department >Telephone: 075-823-1441 Japan >Facsimile: 075-823-1365 Japan >E-mail: mshib****@shima***** ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshib****@shima*****