探し物は何ですか?

私たちはいつも何かを探しながら生きている。
でも、探し物が分かっている場合と分からない場合とがある。
分かっている場合にも、名前が分かっている場合と、その姿形の記憶や写真に映ったそのす姿しか手がかりがない場合などがある。

分からない場合には、探さなくてはならないが、何をどう探さなければならないか見当がつかない場合と、自分でも探したいんだかそうではないのかよく分からない場合がある。

でも、とにかく、私たちは探している。色んなもの、こと、人さえ、探している。
もしかしたら、探すということは、考えるということ、さらには生きるということそのものではないないか。

それはさておき、じゃ、どういう場合にどういう探しかたをするのがよいか。うまく探す方法というのはあるのか。

そういう観点から、今回は前回もLike.comを紹介しながらちょっと触れた「検索エンジン」の奥深い世界に案内します。「検索(searching)」の根本は、私たちが日々やっている「探し物」につながっていて、どこかにしまってあるものを見つけたり、忘れかけていたことを「想起」したりすることと深い関係にあるということが大切なポイントです。インターネットを脳に見立てたときに見えて来ることと言ってもいいかな。

資料20061121_1[能動型検索と受動型検索、そして]

カタログ検索 / 全文検索

  • ウェブ

ディレクトリー検索 / ロボット検索

cf.Amazonの「なか見検索」?
cf.本屋でぱらぱら立ち読みして「これだ」と思って買う?

            • -

cf.catalog, 《英》

1a (品物・本などの)目録,カタログ,一覧表.→
b 【図書館】 図書[蔵書]目録,カタログ.→
2 列記したもの,一覧表 〔of〕.→
3 《米》 大学要覧.
− 〈…の〉目録を作る; 〈…を〉目録に載せる; 分類する.
− 目録を作る,目録に載せる; 分類する.
ギリシャ語「数えあげること」の意)
(『大辞林』)

人手で構築したウェブディレクトリ内を検索するサーバー、システムのこと。人手で構築しているため、質の高いウェブサイトを検索可能。また、サイトの概要を人手で記入しているため、検索結果の一覧から目的のサイトを探しやすいという特長がある。

分類ごとに、人知を用いてウェブサイト単位で登録の可否を審査するWorld Wide Webでの索引集のこと。 ディレクトリ・サービスが、LANなどのコンピュータ・ネットワークでのディレクトリをも含むのに対して、ウェブディレクトリの語は、WWWのディレクトリに対してのみ用いられる。ウェブディレクトリでは、登録されたウェブサイトに関する情報のデータ構造が、必ずツリー構造をなしており、検索エンジンを用いなくとも目的とするカテゴリに辿りつけるようになっている。代表的なウェブディレクトリではその中に登録されているウェブサイトを対象とする検索エンジンが併設されている。これをディレクトリ型検索エンジンという。

の大きな特徴の一つとして、クローラ(スパイダー)を用いることが挙げられる。このことにより、WWW上にある多数の情報を効率よく収集することができる。大規模な検索エンジンでは、30億ページ以上のページから検索が可能になっている。

「這い進む(crawl)もの」を表す英語で、芋虫、無限軌道、WWW巡回プログラムのこと。

クローラーは、WWW上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。WUAの一種。スパイダーまたは単純にロボットとも呼ばれる。
主に検索エンジンのデータベース、インデックス作成に用いられているほか、統計調査などの目的にも利用される。近年では電子メールアドレス収集業者などもクローラーを利用して、迷惑メールの送信効率を上げている。
一般にクローラーは、既知のHTML文書の新しいコピーを要求し、文書中に含まれるリンクをたどり別の文書を収集するという動作を繰り返す。新しい文書を見つけた場合はデータベースに登録する。また、既知のファイルが存在しないことを検出した場合はデータベースから削除する。
(以上『Wikipedia』)