[Tep-j-general] サーチエンジン対策のURL

Back to archive index

hamada bungu****@leo*****
2002年 11月 30日 (土) 15:53:32 JST


こんにちは。

On Sat, 30 Nov 2002 08:04:26 +0900
ここ <coco****@sary*****> wrote:

> もし、実際使ってみてどこまでOKなのかなと思っているのですが、いかが
> でしょうか。

実際に弊社ではコレをtrueにして使っています。特にそのことによる問題は無い
ように感じています。

このスイッチは、falseだと

/catalog/product_info.php?cPath=26_122&products_id=902

となる商品紹介へのURLを

/catalog/product_info.php/cPath/26_122/products_id/902

という風に化かしてくれる(=URLから?や&や=を取っ払う)→「動的なコン
テンツじゃないように見せかける」ものだと理解しているんですけど、最近のロ
ボット、少なくともGoogleは、wiki等への対策なのか、?や&があってもクロール
するっぽいんですが…。

http://www.hotwired.co.jp/webmonkey/99/45/index3a.html

> よくわからないひとのために説明しておくと、検索エンジンはスパイダーやクロー
> ラーといったプログラムを使って、ウェブ・サイトのコンテンツをインデックス
> 化しているんだ。基本的に、URLのなかに/cgi-binやbin(そのほかの変数も)が含
> まれているときや&、?、=などのエスケープ・キャラクターが含まれているとき
> には、クローラーはそのページを無視することになっている。

以前は確かに↑こう言われてたんですけどねぇ。先程試しにGoogleで検索してみ
ましたところ、

pukiwiki.php?%5B%5BBBS%C9%F7%A5%D7%A5%E9%A5%B0%A5%A4%A5%F3%5D%5D

みたいな(?の入った)URLからもちゃんとヒットしてるみたいです。

小原さんのところでは、アクセスログを見ても確かにGoogle経由で飛んでくるか
たが皆無なのでしょうか?

(弊社TEPは先日稼動を始めたばかりですので、アクセスログからいくつかのク
ローラーがrobots.txt見て走っていったのは確認してますが、未だインデックス
化がされていない模様→残念ながら実際に検証出来てはいません)

先にも書きましたとおり、当方もそれほど厳密に検証を繰り返したわけではあり
ませんけども、今のところこのスイッチをtrueにしても特に動作上問題になるよ
うな印象はありません。htmlから

<A href="/catalog/product_info.php?cPath=26_122&products_id=902">こちら
</A>へどうぞ!

みたいなリンクを打たれていないのなら、試しにそのままtrueにしても構わない
のではないでしょうか? 打たれている場合は要修正。

はまだ






Tep-j-general メーリングリストの案内
Back to archive index