応答エンジン? : Answers.comとBrainboostの場合

まだゴロゴロするお腹をさすりながら、前から気になっていたかなり優れものらしい検索エンジンのAnswers.comを調べていた。Answers.comに関するちゃんとした報告はなさそうだったので、自分で試してみて感想を書くしかないと思った。第一印象としては、ロボット検索とディレクトリー検索それぞれの長所を目一杯抽き出して融合させたような「検索」エンジン、といったところ。


  • Answers.com

Classic Homepage:http://www.answers.com/
Deluxe Homepage:http://www.answers.com/main/home_simple.jsp

Answers.comはAnswers(応答)という命名に表れているように、ロボット検索とディレクトリー検索の両面で、「検索(Search)」を「応答(Answer)」に近づけるための工夫が、「これでもか」という勢いで凝らされている。GoogleWikipediaとの連繋もスムースで、これはなかなか使えると思ったが、私が一番関心したのは多言語設定ができる点だった。日本語入力もでき、日本語の「応答ページ」をちゃんと返してくれる。シソーラスWordNetディレクトリのリファレンスとしてあるのは重宝する。

で、一番興味深かったのはAnswers.com自体ではなかった。

というのは、Answers.comを運営するAn Answers.com社は、およそ一年前に英国のBrainboost Technologyを買収した。(当時の記事はこれ。http://www.nikkeibp.co.jp/archives/417/417495.html)。Brainboostという自然言語処理技術を応用した質問応答型の検索エンジンが欲しかったからだ。

そのBrainboostが面白い。これは検索とは何かを考える上で非常に興味深い例だと思った。


「ブレインブースト」。脳をブーストする、脳の働きを補助して促進する、そんなニュアンスの名前。
入力窓の下にある"How is Brainboost different from other search engines?"という不思議なリンクの先のページでは"How is Brainboost different from existing engines like Google?"と、グーグルが対抗馬であることが銘記されたタイトルになっていた。
http://www.brainboost.com/compare.html

そこでは「ブレインブーストは応答エンジンである、グーグルが検索エンジンであるのに対して」とグーグルに代表される検索エンジンとの「差別化」を、せこい差別化ではなく、「検索」を一気に「応答」にまで押し上げるような大胆な理念として掲げている。

その技術的根拠はグーグルのページランク・システムに対抗するかのような「応答ランク・システム(the AnswerRank System)」であるという。それのおかげでブレインブーストは「検索された数百ページを人間のようにintelligently読解し、あなたの質問に対する簡潔な応答を抽き出す」ことで「時間の無駄を省く」ことができるのだという。「嘘だろう」と思うに違いない私のような訪問者のために、ブレインブーストの応答プロセスの一例が、グーグルの検索プロセスとの比較で、非常に分かりやすく書かれている。

Google

  • User types in : “Why is mars red”
  • Google Search engine retrieves all pages containing words "mars" and red".
  • Search results are sorted by the number of links each one of them got from other pages. This is a good way to figure out which one of them is most trusted by others.
  • Results are displayed with the snippet being the appearance of the question on the pages
  • Typically, a user would then click on the first search result, read through the document and hope to find an answer.
  • If an answer is not found within the first search result, the user needs to repeat this process with the next search result, sometimes having to read many web pages to finally get at the answer.

Brainboost

  • User types in : “Why is mars red”
  • Brainboost translates the query into multiple queries that will raise the probability of finding the ANSWER to the question.
  • Brainboost retrieves search engine results.
  • Brainboost retrieves top several hundred pages and reads them.
  • Brainboost finds answers and ranks them based on it's proprietary AnswerRank? technology. AnswerRank? knows to look at a set of many possible answers and rank them as to which one is probably the most correct. In this case: "Mars is red because of the iron in the soil"
  • Brainboost displays the ANSWERS to the user

なるほど。

Brainboostの思想の基盤は、「人間とは質問する存在である」ということのようだ。で、その質問のパターンは多いようで実は限られていて、中学校の英語で習う5W1Hに収斂する。「いつ?」、「どこで?」、「なぜ?」、「何?」、「誰?」、「どうやって?」。どんな高級な探究も、煎じ詰めれば、5W1H型の質問になる、というわけだ。それで、何かを知りたい場合に、インターネット上の膨大な情報を前にして5W1H型の問いかけができて、それに対する満足のいく答えが返ってくれば、それに越したことはない。Brainboostを開発した英国のエンジニアたちは、そのためのアルゴリズムを一生懸命考えたのだと思う。ここ数年話題になっている、セマンティック・ウェブの研究・開発との接点も気になるところだ。

しかし、どうだろう?と私は感じた。たしかに、簡単な疑問文を入力してから後の処理プロセスは大したもんなのかもしれないが、私なんかは、そもそも人間は何をどう質問していいか分からない状態が普通で、そのような頭の中の「もやもや」を“Why is mars red”のようないわゆる5W1H型の基本的な疑問文に「落とし込む」までのプロセスこそが、一番人間的、実はintelligentなプロセスなのではないか、と思ってしまう。

人間は問いかける存在である、かもしれないが、なにをどう問いかければいいのかをも学ばなければならない存在でもあると思う。その意味では、Brainboostはかなり高尚な応答エンジン、検索エンジンであると言えると思う。質問と応答という場面に的を絞った人間の「知的活動」をコンピュータに肩代わりさせようとする試みが見落としているのは、質問の形をとるにいたるまでの「もやもや」の状態の処理方法なのだと思う。

Brainboostは、人間の知的活動の上澄みのような言語的パターンにとらわれ過ぎているように感じた。

そうはいっても、人間の知的活動の一端をこのような形で実現することだけでも大変な尊敬すべきことだ。そして、逆にそれくらい人間が普段いとも簡単にやってのけていることがすごいことなんだということを再認識すべきなんだと思う。それに、Brainboostは「遊べる」というか、「考えさせてくれる」。知りたいことがある場合に、それをどういうふうに質問すればいいかを考えるための、よいレッスンになると感じた。考えるためのよい相手になってくれる。

パパイヤ鈴木のようなBrainboostのイメージ・キャラクターは可愛い。

日本では「応答エンジン」としては日本語版もあるAsk.comの方が知られているようだが、Brainboostのような荒削りの魅力には欠ける。

Ask.com http://www.ask.com/?o=333