Webクローラとは、インターネット上のWebサーバからWebページを網羅的に収集し、検索エンジンのデータベースに反映させるためのシステムです。
「ichiro」は、NTTレゾナント株式会社が運用しているWebクローラの名称です。
ichiroは、画像、動画の検索サービスですので、HTMLページだけでなく、画像、動画も収集させて頂きます。
また、システムの研究開発のための収集をさせて頂く場合もあります。
認識するのは、”User-agent:”、 “Disallow:”、 “Allow:” です。
robots.txt の書き方については、以下URLをご参照ください。
認識するのは、”NOINDEX”、”NOFOLLOW”、 “NOARCHIVE”、 “NOIMAGEINDEX”、 “NONE”、 “FOLLOW”、 “INDEX”、 “ALL”、 “NOSERVE”、 “SERVE”、 “ARCHIVE”、 “NOIMAGECLICK”です。 META TAG の書き方については、以下URLをご参照ください。
これは、複数のドメイン名を持つ Webサーバに対しても同様です。ある Webサーバが、A と B という二つのドメイン名を持っていても、A と B に同時に接続する事は致しません。
収集間隔は状況によって変更されますが、動画等のファイルを収集した後は、長めに間隔をあける等の制御を行っています。
「goo_vsearch」は、NTTレゾナント株式会社が運用しているWebクローラの名称です。
また、システムの研究開発のための収集をさせて頂く場合もあります。
認識するのは、”User-agent:”、 “Disallow:”、 “Allow:” です。
robots.txt の書き方については、以下URLをご参照ください。
認識するのは、”NOFOLLOW”、 “NOINDEX” です。META TAG の書き方については、以下URLをご参照ください。
これは、複数のドメイン名を持つ Webサーバに対しても同様です。ある Webサーバが、A と B という二つのドメイン名を持っていても、A と B に同時に接続する事は致しません。
収集間隔は状況によって変更されますが、webページを収集した後は、一定間隔をあける等の制御を行っています。
※「goo_vsearch」に関するお問い合わせの際は、件名または本文に「goo_vsearchについて」とお書き添えください。
gooblogsearch/[バージョン]
例:gooblogsearch/2.0
認識するのは、”User-agent:”、 “Disallow:”です。
認識するのは、”NOINDEX”です。