From hi06fu06 @ mh.pikara.ne.jp Mon Aug 6 21:10:43 2012 From: hi06fu06 @ mh.pikara.ne.jp (hi fu) Date: Mon, 6 Aug 2012 21:10:43 +0900 Subject: [fess-user 596] =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8lbSE8GyhC?= =?iso-2022-jp?b?GyRCJWs8QjlUJE40VjNWJEskRCQkJEYbKEI=?= Message-ID: はじめまして。 fessを最近知り、やりたかったことが簡単にできそうでとても有難いです。 表題についての適切な設定がよく解らないので教えて頂きたいのですが、 Windowsサーバに Tomcat7.0 と fess-server-6.0.0 を導入し、フォルダの 中のファイル(Excel、Word、PDF、html・・・)を全文検索しています。 このフォルダは共有フォルダで、ほかのパソコンからファイルの登録や 参照・変更、ファイル削除など自由に随時行います。 フォルダの中には何ケ月も変更されないままのファイルもあれば、1週間前 に更新されたものや、10分前に新規保存されたものまで様々です。 中には1時間前に削除されたものもあります。 クロールを実行する時点で、そのフォルダの中にあるすべてのファイルの インデックスを作成(全文検索できるように)したいのですが、現在の設定 は、 ・「差分クロール」:有効 ・「インデックスの有効期限」:1日 ・クロールの実行:0 0 * * * ? (←○○時ちょうど:1時間おき:のつもり)   ※サーバは毎朝起動し、夕方終業時にシャットダウン 上記の設定・運用だと、ちょうど24時間後のクロール実行後に 「追加されたドキュメント」がすべて消えたような状態になっているんです。 で、その1時間後のクロールでまたドキュメントが追加されます。(空白の1時間) この時は、フォルダの文書はどれも更新していないので、そのためにインデックス の有効期限の「1日」が効いて全て消えたのかと思うのですが、 ファイルをどれも更新しないと、このような動きになるのでしょうか? その空白の1時間の間に運悪く利用者が全文検索をかけると何も検索されな いとなってしまいますが、これは仕方ないのでしょうか? (「インデックスの有効期限」:なし は削除したファイルの情報がずっと残るよう  なので使いたくないです。) よろしくお願いします。 From shinsuke @ yahoo.co.jp Wed Aug 8 21:52:09 2012 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 8 Aug 2012 21:52:09 +0900 Subject: [fess-user 597] Re: =?iso-2022-jp?b?ZmVzcy5vdXQbJEIlbSUwJEcbKEIgJ0VSUk9SIGpwLnNm?= =?iso-2022-jp?b?LmZlc3MudGFzay5TZWFyY2hMb2dUYXNrIC0gRmFpbGVkIHRv?= =?iso-2022-jp?b?IHN0b3JlIGEgc2VhcmNoIGxvZy4nGyRCJCxIL0A4GyhC?= Message-ID: 菅谷です。 (スパム防止のため、FessのMLへの登録が必要になります) 情報をありがとうございます。 XMLリクエストのときに検索ログの登録に失敗している 可能性があるので、チケットを上げて対応しておきます。 > 導入当初からlogsフォルダの中にも、search log はなかったように思います。 検索ログは統計情報などもあるので、ファイルではなく、 DBに格納されます。 よろしくお願いいたします。 菅谷 2012年8月8日 16:01 : > From: 浜本 > To: fess-user @ lists.sourceforge.jp > Cc: > Date: Wed, 08 Aug 2012 16:01:05 +0900 > Subject: fess.outログで 'ERROR jp.sf.fess.task.SearchLogTask - Failed to store a search log.'が発生 > はじめまして。 > > > 現在Fess7.0を使って、検索エンジンを運用させていただいております。 > 6.0の時もそうだったのですが、fess.outに表題どおり下記エラーが表示されています。 > > 2012-08-08 15:37:33,795 [chronos-pool-4-thread-1630] ERROR jp.sf.fess.task.SearchLogTask - Failed to store a search log. > java.lang.NullPointerException > at jp.sf.fess.helper.SearchLogHelper.processSearchLogQueue(SearchLogHelper.java:107) > at jp.sf.fess.helper.SearchLogHelper.storeSearchLog(SearchLogHelper.java:82) > at jp.sf.fess.task.SearchLogTask.doExecute(SearchLogTask.java:63) > at jp.sf.fess.task.SearchLogTask$$EnhancedByS2AOP$$7f23663b.$$doExecute$$invokeSuperMethod$$(SearchLogTask$$EnhancedByS2AOP$$7f23663b.java) > at jp.sf.fess.task.SearchLogTask$$EnhancedByS2AOP$$7f23663b$$MethodInvocation$$doExecute0.proceed(MethodInvocationClassGenerator.java) > at org.seasar.framework.aop.interceptors.TraceInterceptor.invoke(TraceInterceptor.java:56) > at jp.sf.fess.task.SearchLogTask$$EnhancedByS2AOP$$7f23663b$$MethodInvocation$$doExecute0.proceed(MethodInvocationClassGenerator.java) > at jp.sf.fess.task.SearchLogTask$$EnhancedByS2AOP$$7f23663b.doExecute(SearchLogTask$$EnhancedByS2AOP$$7f23663b.java) > at sun.reflect.GeneratedMethodAccessor118.invoke(Unknown Source) > at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25) > at java.lang.reflect.Method.invoke(Method.java:597) > at org.seasar.framework.util.MethodUtil.invoke(MethodUtil.java:96) > at org.seasar.framework.beans.impl.BeanDescImpl.invoke(BeanDescImpl.java:218) > at org.seasar.chronos.core.delegate.MethodInvoker.invoke(MethodInvoker.java:342) > at org.seasar.chronos.core.delegate.MethodInvoker$1.call(MethodInvoker.java:177) > at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:303) > at java.util.concurrent.FutureTask.run(FutureTask.java:138) > at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886) > at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908) > at java.lang.Thread.run(Thread.java:662) > > > Fessにxml取得URLを投げて検索したときに発生し、 > 事象としては、Fess7の利用者情報・検索ログに検索履歴が反映されないようです。 > > search log がないのが原因だとは思うのですが、 > 導入当初からlogsフォルダの中にも、search log はなかったように思います。 > > また、導入当初は問題なく履歴が書き込まれておりましたが、 > 導入から数日後経った後、エラーが発生するようになりました。 > > 現在、運用上特に問題ありませんが、可能であれば > 履歴等も確認出来ればと思い、ご連絡を差し上げました。 > > もし、設定や、原因等私の運用上何かミスを犯しているのであれば > お教えいただければと思います。 > > 何卒ご教示のほど、よろしくお願い致します。 > > From shinsuke @ yahoo.co.jp Wed Aug 8 21:58:48 2012 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 8 Aug 2012 21:58:48 +0900 Subject: [fess-user 598] Re: =?iso-2022-jp?b?R0VPGyRCJSQlcyVHJUMlLyU5JE5FUE8/Sn1LISROGyhC?= =?iso-2022-jp?b?GyRCN28bKEI=?= Message-ID: 菅谷です。 (スパム防止のため、FessのMLへの登録が必要になります) あまりわかりやすいドキュメントではありませんが 以下になります。 http://fess.sourceforge.jp/ja/6.0/config/geosearch.html インデックス登録は Solr のお作法に従うように していると思います。 http://wiki.apache.org/solr/SpatialSearch/ よろしくお願いいたします。 shinsuke 2012年8月8日 21:22 : > ---------- 転送メッセージ ---------- > From: 鈴木ヒロミチ > To: fess-user @ lists.sourceforge.jp > Cc: > Date: Wed, 08 Aug 2012 21:21:57 +0900 > Subject: GIOインデックスの登録方法の件 > おせわになります。最近、この存在を知り、利用できるか検討中の鈴木です。 > このシステムはとても興味があります。 > ところで、 > GIOインデックス(Lat,Lon)の登録方法を教えていただけないでしょうか? > どのデータベースに登録すべきかだけでも結構です。 >  src.h2.config.h2.fess.ddlやsolr.conf.schema.xmlでは見当たりませんでし > たがどこに登録するの でしょうか? > > > よろしければご教授ください。 >  お願いします。 > > From shinsuke @ yahoo.co.jp Wed Aug 8 22:10:27 2012 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 8 Aug 2012 22:10:27 +0900 Subject: [fess-user 599] Re: =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8bKEI=?= =?iso-2022-jp?b?GyRCJW0hPCVrPEI5VCRONFYzViRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: 菅谷です。 Fess 7 ではそのあたりの実装を変更したのですが、 申し訳ありませんが、Fess 6 では差分更新を有効に すると、そのような動きになってしまいますので、 差分クロールを無効にしていただくのが良いかと 思います。 よろしくお願いいたします。 shinsuke 2012年8月6日 21:10 hi fu : > はじめまして。 > fessを最近知り、やりたかったことが簡単にできそうでとても有難いです。 > 表題についての適切な設定がよく解らないので教えて頂きたいのですが、 > > Windowsサーバに Tomcat7.0 と fess-server-6.0.0 を導入し、フォルダの > 中のファイル(Excel、Word、PDF、html・・・)を全文検索しています。 > このフォルダは共有フォルダで、ほかのパソコンからファイルの登録や > 参照・変更、ファイル削除など自由に随時行います。 > フォルダの中には何ケ月も変更されないままのファイルもあれば、1週間前 > に更新されたものや、10分前に新規保存されたものまで様々です。 > 中には1時間前に削除されたものもあります。 > > クロールを実行する時点で、そのフォルダの中にあるすべてのファイルの > インデックスを作成(全文検索できるように)したいのですが、現在の設定 > は、 > ・「差分クロール」:有効 > ・「インデックスの有効期限」:1日 > ・クロールの実行:0 0 * * * ? (←○○時ちょうど:1時間おき:のつもり) > > >   ※サーバは毎朝起動し、夕方終業時にシャットダウン > > 上記の設定・運用だと、ちょうど24時間後のクロール実行後に > 「追加されたドキュメント」がすべて消えたような状態になっているんです。 > で、その1時間後のクロールでまたドキュメントが追加されます。(空白の1時間) > この時は、フォルダの文書はどれも更新していないので、そのためにインデックス > の有効期限の「1日」が効いて全て消えたのかと思うのですが、 > ファイルをどれも更新しないと、このような動きになるのでしょうか? > その空白の1時間の間に運悪く利用者が全文検索をかけると何も検索されな > いとなってしまいますが、これは仕方ないのでしょうか? > (「インデックスの有効期限」:なし は削除したファイルの情報がずっと残るよう >  なので使いたくないです。) > > よろしくお願いします。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user From hi06fu06 @ mh.pikara.ne.jp Sat Aug 11 11:38:02 2012 From: hi06fu06 @ mh.pikara.ne.jp (hi fu) Date: Sat, 11 Aug 2012 11:38:02 +0900 Subject: [fess-user 600] Re: =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8bKEI=?= =?iso-2022-jp?b?GyRCJW0hPCVrPEI5VCRONFYzViRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: <0A3838AC9BB2434FBC0FCC7F534B7D05@VISTAFK> 菅谷 様 お世話になります。 実は、先の質問を投げようと思った日にちょうどホームページでFess 7が リリースされ、そのあとすぐFess 7に環境を変えて使ってみたんですが、 結果は同じでした。空白の1時間が同じように発生しました。 Tomcatから削除して新規に構築した(つもり)ですが私の構築ミスで しょうか・・・admin画面の左のメニューの下のほうに追加の項目もあった のでFess 7で動作していると思うのですが・・・ ----- Original Message ----- From: "Shinsuke Sugaya" To: Sent: Wednesday, August 08, 2012 10:10 PM Subject: [fess-user 599] Re:インデックスの有効期限とクロール実行の間隔について > 菅谷です。 > > Fess 7 ではそのあたりの実装を変更したのですが、 > 申し訳ありませんが、Fess 6 では差分更新を有効に > すると、そのような動きになってしまいますので、 > 差分クロールを無効にしていただくのが良いかと > 思います。 > > よろしくお願いいたします。 > > shinsuke > > > 2012年8月6日 21:10 hi fu : >> はじめまして。 >> fessを最近知り、やりたかったことが簡単にできそうでとても有難いです。 >> 表題についての適切な設定がよく解らないので教えて頂きたいのですが、 >> >> Windowsサーバに Tomcat7.0 と fess-server-6.0.0 を導入し、フォルダの >> 中のファイル(Excel、Word、PDF、html・・・)を全文検索しています。 >> このフォルダは共有フォルダで、ほかのパソコンからファイルの登録や >> 参照・変更、ファイル削除など自由に随時行います。 >> フォルダの中には何ケ月も変更されないままのファイルもあれば、1週間前 >> に更新されたものや、10分前に新規保存されたものまで様々です。 >> 中には1時間前に削除されたものもあります。 >> >> クロールを実行する時点で、そのフォルダの中にあるすべてのファイルの >> インデックスを作成(全文検索できるように)したいのですが、現在の設定 >> は、 >> ・「差分クロール」:有効 >> ・「インデックスの有効期限」:1日 >> ・クロールの実行:0 0 * * * ? (←○○時ちょうど:1時間おき:のつもり) >> >> >> >>   ※サーバは毎朝起動し、夕方終業時にシャットダウン >> >> 上記の設定・運用だと、ちょうど24時間後のクロール実行後に >> 「追加されたドキュメント」がすべて消えたような状態になっているんです。 >> で、その1時間後のクロールでまたドキュメントが追加されます。(空白の1時間) >> >> この時は、フォルダの文書はどれも更新していないので、そのためにインデックス >> >> の有効期限の「1日」が効いて全て消えたのかと思うのですが、 >> ファイルをどれも更新しないと、このような動きになるのでしょうか? >> その空白の1時間の間に運悪く利用者が全文検索をかけると何も検索されな >> いとなってしまいますが、これは仕方ないのでしょうか? >> (「インデックスの有効期限」:なし は削除したファイルの情報がずっと残るよう >>  なので使いたくないです。) >> >> よろしくお願いします。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Sat Aug 11 22:40:43 2012 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Sat, 11 Aug 2012 22:40:43 +0900 Subject: [fess-user 601] Re: =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8bKEI=?= =?iso-2022-jp?b?GyRCJW0hPCVrPEI5VCRONFYzViRLJEQkJCRGGyhC?= In-Reply-To: <0A3838AC9BB2434FBC0FCC7F534B7D05@VISTAFK> References: <0A3838AC9BB2434FBC0FCC7F534B7D05@VISTAFK> Message-ID: 菅谷です。 申し訳ありません。ちょっといくつか修正したのですが 以下ではいかがでしょうか? http://fess.sourceforge.jp/repository/snapshot/fess-server-7.1.0-SNAPSHOT.zip 今、利用していただいているものの webapps/fess/WEB-INF/classes/jp を置き換えていただくのでも問題ないかと 思います。 よろしくお願いいたします。 shinsuke 2012年8月11日 11:38 hi fu : > 菅谷 様 > お世話になります。 > > 実は、先の質問を投げようと思った日にちょうどホームページでFess 7が > リリースされ、そのあとすぐFess 7に環境を変えて使ってみたんですが、 > 結果は同じでした。空白の1時間が同じように発生しました。 > Tomcatから削除して新規に構築した(つもり)ですが私の構築ミスで > しょうか・・・admin画面の左のメニューの下のほうに追加の項目もあった > のでFess 7で動作していると思うのですが・・・ > > > ----- Original Message ----- > From: "Shinsuke Sugaya" > To: > Sent: Wednesday, August 08, 2012 10:10 PM > Subject: [fess-user 599] Re:インデックスの有効期限とクロール実行の間隔について > > > >> 菅谷です。 >> >> Fess 7 ではそのあたりの実装を変更したのですが、 >> 申し訳ありませんが、Fess 6 では差分更新を有効に >> すると、そのような動きになってしまいますので、 >> 差分クロールを無効にしていただくのが良いかと >> 思います。 >> >> よろしくお願いいたします。 >> >> shinsuke >> >> >> 2012年8月6日 21:10 hi fu : >>> はじめまして。 >>> fessを最近知り、やりたかったことが簡単にできそうでとても有難いです。 >>> 表題についての適切な設定がよく解らないので教えて頂きたいのですが、 >>> >>> Windowsサーバに Tomcat7.0 と fess-server-6.0.0 を導入し、フォルダの >>> 中のファイル(Excel、Word、PDF、html・・・)を全文検索しています。 >>> このフォルダは共有フォルダで、ほかのパソコンからファイルの登録や >>> 参照・変更、ファイル削除など自由に随時行います。 >>> フォルダの中には何ケ月も変更されないままのファイルもあれば、1週間前 >>> に更新されたものや、10分前に新規保存されたものまで様々です。 >>> 中には1時間前に削除されたものもあります。 >>> >>> クロールを実行する時点で、そのフォルダの中にあるすべてのファイルの >>> インデックスを作成(全文検索できるように)したいのですが、現在の設定 >>> は、 >>> ・「差分クロール」:有効 >>> ・「インデックスの有効期限」:1日 >>> ・クロールの実行:0 0 * * * ? (←○○時ちょうど:1時間おき:のつもり) >>> >>> >>> >>>   ※サーバは毎朝起動し、夕方終業時にシャットダウン >>> >>> 上記の設定・運用だと、ちょうど24時間後のクロール実行後に >>> 「追加されたドキュメント」がすべて消えたような状態になっているんです。 >>> で、その1時間後のクロールでまたドキュメントが追加されます。(空白の1時間) >>> >>> この時は、フォルダの文書はどれも更新していないので、そのためにインデックス >>> >>> の有効期限の「1日」が効いて全て消えたのかと思うのですが、 >>> ファイルをどれも更新しないと、このような動きになるのでしょうか? >>> その空白の1時間の間に運悪く利用者が全文検索をかけると何も検索されな >>> いとなってしまいますが、これは仕方ないのでしょうか? >>> (「インデックスの有効期限」:なし は削除したファイルの情報がずっと残るよう >>>  なので使いたくないです。) >>> >>> よろしくお願いします。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user From hi06fu06 @ mh.pikara.ne.jp Sat Aug 18 22:28:55 2012 From: hi06fu06 @ mh.pikara.ne.jp (hi fu) Date: Sat, 18 Aug 2012 22:28:55 +0900 Subject: [fess-user 602] Re: =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8bKEI=?= =?iso-2022-jp?b?GyRCJW0hPCVrPEI5VCRONFYzViRLJEQkJCRGGyhC?= In-Reply-To: References: <0A3838AC9BB2434FBC0FCC7F534B7D05@VISTAFK> Message-ID: <5050246BCBD842A99BB1534D88AC7906@VISTAFK> 菅谷 様 お手数おかけします。 お盆休みと、テスト結果が24時間後でないと解らないため日が開いて しまいました。 > http://fess.sourceforge.jp/repository/snapshot/fess-server-7.1.0-SNAPSHOT.zip 上を、 > webapps/fess/WEB-INF/classes/jp > を置き換えていただくのでも問題ないかと で試してみました。(2台のサーバで) 結果は変わらず、やはり有効期限:1日(24時間)後のクロールでインデックス が全て削除され、その1時間後のクロールでインデックスが再構築されました。 fessをお使いの他の方はこんな現象は出てないのでしょうか・・・? 「差分クロール」を使うと出るとおっしゃってましたが、ヘルプに「差分クロール」 の説明が無かったのですが、本来はどんな動作になるのでしょうか? そろそろ本運用に入ろうと思っているのですが、この動作によっていくらか 設定や使い方を工夫しないといけないかなと感じています。 よろしくお願いいたします。 From shinsuke @ yahoo.co.jp Fri Aug 31 16:40:56 2012 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 31 Aug 2012 16:40:56 +0900 Subject: [fess-user 603] Re: =?iso-2022-jp?b?GyRCJSQlcyVHJUMlLyU5JE5NLTh6NHw4QiRIJS8bKEI=?= =?iso-2022-jp?b?GyRCJW0hPCVrPEI5VCRONFYzViRLJEQkJCRGGyhC?= In-Reply-To: <5050246BCBD842A99BB1534D88AC7906@VISTAFK> References: <0A3838AC9BB2434FBC0FCC7F534B7D05@VISTAFK> <5050246BCBD842A99BB1534D88AC7906@VISTAFK> Message-ID: 菅谷です。 返信が遅くなり申し訳ありません。 いろいろと確認したところ、うまくいっていないところが あったので、修正しました。最新のスナップショットビルドで あれば大丈夫かと思います。 よろしくお願いいたします。 shinsuke 2012年8月18日 22:28 hi fu : > 菅谷 様 > お手数おかけします。 > > お盆休みと、テスト結果が24時間後でないと解らないため日が開いて > しまいました。 > >> http://fess.sourceforge.jp/repository/snapshot/fess-server-7.1.0-SNAPSHOT.zip > > 上を、 > >> webapps/fess/WEB-INF/classes/jp >> を置き換えていただくのでも問題ないかと > > で試してみました。(2台のサーバで) > 結果は変わらず、やはり有効期限:1日(24時間)後のクロールでインデックス > が全て削除され、その1時間後のクロールでインデックスが再構築されました。 > fessをお使いの他の方はこんな現象は出てないのでしょうか・・・? > > 「差分クロール」を使うと出るとおっしゃってましたが、ヘルプに「差分クロール」 > の説明が無かったのですが、本来はどんな動作になるのでしょうか? > そろそろ本運用に入ろうと思っているのですが、この動作によっていくらか > 設定や使い方を工夫しないといけないかなと感じています。 > > よろしくお願いいたします。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user