畠山真一
hatak****@n2sm*****
2014年 10月 6日 (月) 22:39:01 JST
畠山です。 URL欄に記述している以下の3つがクロール出来ていないと思われますが、 ホストAにのみ適用しているラベルやロールなどの設定はありますでしょうか。 http://ホストA/ <http://xn--a-pfuzb3d/>フォルダーパスA/index.html http:// ホストA/フォルダーパスB/index.html http:// ホストA/フォルダーパスC/index.html また、自動でコミットされないのは問題が起こっている可能性がありますので、 ログレベルをdebugにして確認して頂けますでしょうか。 よろしくお願いいたします。 2014年10月1日 12:22 Kimura,Ryo <ryo.k****@jp*****>: > Kimuraです。 > > ここ2か月位の間、社内ポータル用のサイト内検索としてFessを設定していますが、 > 以前設定していた通りのURLのインデックスができません。 > ウェブクロールの設定→URL欄に各htmlページパスを記載しているのですが、4つの内、1つ > のページしかインデックスされません。 > ActiveDirectoryでネットワークを構成しているため、其々のアクセス権、文字エンコード等も統一していても > 常に決まったページしかインデックスされません。 > > また下記の通り、ヘルプにはクロール後インデックスデータを手動でコミットする必要がないと書かれていますが、 > 新しいインデックスができるとコミットしないと検索ができない状態になります。 > コミットまでのタイミングがあるのでしょうか。 > > >設定項目 > >Solr サーバーへのアクション > >特に問題がなければ、手動でコミットや最適化を実行する必要はありません。 > > > 【当方の環境】 > Fessバージョン:fess-server-9.1.0 > JAVAバージョン:jdk1.7.0_65 > サーバ環境:OS:Windows Server2008 R2 Standerd 64bit > 単独でFessをインストール > *サービス起動しない形でtomcat6w.exe > > 【Log】 > 2014-09-30 00:00:10,114 [Web Crawling Process] WARN > org.seasar.framework.container.assembler.BindingTypeShouldDef - > org.seasar.robot.client.FaultTolerantClientのプロパティ(requestListener)が見つからないので設定をスキップします > 2014-09-30 00:00:10,146 [Web Crawling Process] INFO > jp.sf.fess.helper.WebFsIndexHelper - Target URL: http://ホストA/ > <http://xn--a-pfuzb3d/>フォルダーパスA/index.html > 2014-09-30 00:00:10,146 [Web Crawling Process] INFO > jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// > ホストA/フォルダーパスB/index.html > 2014-09-30 00:00:10,146 [Web Crawling Process] INFO > jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// > ホストA/フォルダーパスC/index.html > 2014-09-30 00:00:10,302 [Data Crawling Process] INFO > jp.sf.fess.helper.DataIndexHelper - No crawling target urls. > 2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホスト名/ > <http://xn--zck4a3ct33s/>フォルダーパスB/index.html > 2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO > org.seasar.robot.client.http.HcHttpClient - Checking URL: > http://daysysman2/robots.txt > 2014-09-30 00:00:10,803 [Robot-20140930000000-1-1] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://ホストA/ <http://xn--a-pfuzb3d/>フォルダパスC/index.html > 2014-09-30 00:00:10,803 [Robot-20140930000000-1-3] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://ホストA/ <http://xn--a-pfuzb3d/>フォルダパスB/index.html > 2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://go.microsoft.com/fwlink/?LinkID=66439 > 2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO > org.seasar.robot.client.http.HcHttpClient - Checking URL: > http://go.microsoft.com/robots.txt > 2014-09-30 00:00:41,535 [Robot-20140930000000-1-1] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601 > 2014-09-30 00:00:41,644 [Robot-20140930000000-1-2] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://ホストA/ <http://xn--a-pfuzb3d/>フォルダパスC/index2.html > 2014-09-30 00:00:41,676 [Robot-20140930000000-1-2] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Not modified URL: > http://ホストA/ <http://xn--a-pfuzb3d/>フォルダパスC/index2.html > 2014-09-30 00:00:53,547 [Robot-20140930000000-1-3] INFO > org.seasar.robot.client.http.HcHttpClient - Could not process > http://go.microsoft.com/robots.txt. go.microsoft.com > 2014-09-30 00:00:56,215 [Robot-20140930000000-1-3] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to > http://go.microsoft.com/fwlink/?LinkID=66439 > 2014-09-30 00:00:56,231 [Robot-20140930000000-1-1] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to > http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601 > 2014-09-30 00:01:10,396 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater > - The number of a crawled document is 3. The processing size is 3. The > execution time is 94ms. > 2014-09-30 00:01:10,739 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater > - The number of a crawled document is 0. The processing size is 0. The > execution time is 16ms. > 2014-09-30 00:01:10,739 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater > - Sending 1 document to a server. > 2014-09-30 00:01:10,832 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater > - Sent 1 documents. The execution time is 93ms. > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user > -- --------------------------------------------------------- 株式会社エヌツーエスエム 畠山 真一 〒101-0024 東京都千代田区神田和泉町1-3-10 第一西川ビル3F Tel:03-5835-0020 Fax:03-5835-0021 hatak****@n2sm***** <manab****@n2sm*****> http://www.n2sm.net --------------------------------------------------------- -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Descargar