limol****@nifty*****
limol****@nifty*****
2011年 4月 30日 (土) 17:44:57 JST
クニカタです。お世話になっております。 標記の件、対応ありがとうございます! 連休あけに試してみる予定にしてます。 また報告します。 ----- Original Message ----- >Date: Fri, 29 Apr 2011 17:30:41 +0900 >From: Shinsuke Sugaya <shins****@yahoo*****> >To: fess-****@lists***** >Subject: [fess-user 478] Re: > 差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される件 > > >菅谷です. > >遅くなってしまいましたが, >最新のスナップショットで対応しました. >4.0 のファイルを差し替えて動くかわかりませんが >以下のファイルを変更しました. > >webapps/fess/WEB-INF/classes/jp/sf/fess/action/admin/SearchListAction$1.class >webapps/fess/WEB-INF/classes/jp/sf/fess/action/admin/SearchListAction.class >webapps/fess/WEB-INF/classes/jp/sf/fess/robot/FessS2RobotThread.class > >よろしくお願いいたします. > >shinsuke > >2011年4月10日20:27 <limol****@nifty*****>: >> クニカタです。お世話になっております。 >> >> お返事ありがとうございます。 >> 期待しております! >> >> --- >> 菅谷さんのすばやい対応と、的確なサポート等から、 >> プロジェクトに対する意気込みみたいなものが >> 伝わってきますな。 >> これからも、よろしくお願いいたします。 >> 応援しています〜 >> >> ----- Original Message ----- >>>Date: Sun, 10 Apr 2011 10:47:58 +0900 >>>From: Shinsuke Sugaya <shins****@yahoo*****> >>>To: fess-****@lists***** >>>Subject: [fess-user 463] Re: >>> 差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される 件 >>> >>> >>>菅谷です。 >>> >>>ご指摘いただきありがとうございます。 >>>Solrのバージョンを上げれば、設定で回避できそうな気が >>>しますが、Fess 4.x では Fess 用の Solr プラグインなどで >>>対応できないかを検討したいと思います。ですので、申し訳 >>>ありませんが少々お待ちください…。 >>> >>>shinsuke >>> >>> >>>2011年4月8日20:06 <limol****@nifty*****>: >>>> クニカタです。お世話になっております。 >>>> >>>> Fess4.0で差分クロールのテスト中、標記状況に遭遇しました。 >>>> >>>> 前回クロール時からファイル内容は更新されていないのですが、 >>>> 必ず毎回インデックスが登録されているファイルがいくつかあり >>>> ました。 >>>> 共通している点は、長い日本語のファイル名ということでした。 >>>> >>>> 調査したところ、該当の長いファイル名のものについては、 >>>> 更新の有無を確認するためのSolrへの問い合わせ結果 >>>> 件数が0(hits=0)で返るため、毎回登録されていました。 >>>> >>>> 以下、ざっと確認した状況をまとめます。 >>>> ---- >>>> ●環境とクロール設定 >>>> OS : Windows(XPと2003) >>>> 差分クロール : 有効 >>>> インデックスの有効期限 : なし >>>> ファイルシステムクロール-ブラウザ : PC >>>> >>>> ●OKケースだった対象ファイル >>>> 内容の更新がない場合、再クロール対象とならない(Solrから「hits=1」が返る) >>>> 【ファイルパス】 >>>> E:\DocumentFiles\FileNameLen\ >>>> 022_■いうえおあいうえお■いうえおあいうえお■い.txt >>>> 【id】 >>>> file:/E:/DocumentFiles/FileNameLen/022_%E2%96%A0%E3%81%84%E3%81%86%E3%81 >>>> %88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81%8A%E2%96%A0%E3%81 >>>> %84%E3%81%86%E3%81%88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81 >>>> %8A%E2%96%A0%E3%81%84.txt;type=pc >>>> >>>> ●NGケースの対象ファイル >>>> 内容の更新がない場合でも、再クロール対象となってしまった(Solrから >>>> 「hits=0」が返る) >>>> 【ファイルパス】 >>>> E:\DocumentFiles\FileNameLen\ >>>> 023_■いうえおあいうえお■いうえおあいうえお■いう.txt >>>> 【id】 >>>> file:/E:/DocumentFiles/FileNameLen/023_%E2%96%A0%E3%81%84%E3%81%86%E3%81 >>>> %88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81%8A%E2%96%A0%E3%81 >>>> %84%E3%81%86%E3%81%88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81 >>>> %8A%E2%96%A0%E3%81%84%E3%81%86.txt;type=pc >>>> >>>> ---- >>>> ・上記OKケースより短い日本語ファイル名は、OK >>>> 上記NGケースより長い日本語ファイル名は、やはりNG >>>> となっていましたので、ここらへんが境界なのではないか >>>> と思ってます。 >>>> >>>> ・solr管理画面から、「id:"〜該当の長いid〜"」 >>>> で検索した場合も、結果0件となっていました。 >>>> ので、Solr側の問題なんだと思ってます。 >>>> >>>> Solr側の設定などで、回避できる方法をご存知で >>>> あればご教授いただきたく、よろしくお願いいたします〜 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-****@lists***** >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-****@lists***** >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-****@lists***** >http://lists.sourceforge.jp/mailman/listinfo/fess-user