イメージ検索エンジンLike.com

私の「画像検索」へのこだわりを見兼ねて、bookscannerさんが大変興味深い事例を示唆してくださった。

それは、TechCrunchが取り上げていたイメージ検索エンジンLike.comである。TechCrunchとは「次世代の Web 2.0のサービスや企業をひたすら評価し紹介していくことを標榜する」すでに定評のあるウェブログである。

2006年11月9日「RiyaのLike.comは最初のホンモノのイメージ検索」

この記事から適宜引用しながら「最初のホンモノのイメージ検索エンジン」Like.comについて感想を書いておきたい。

Like.comは、シリコンバレーの一新興企業 Riya (人間の顔の認識に焦点を合わせた画像技術を開発しているらしい)が同社のコアテクノロジーを利用して11/8にスタートさせた新しい「ホンモノのイメージ検索エンジン」である。

Like.com

ウェブ上の数多のイメージ検索エンジンが「まだホンモノではない」のは、検索が「テキスト入力」しか受け付けないからである。そして、

それらは検索をテキストで入力し、そのテキストを画像ファイ ルに添付されたメタデータのテキストと比較することによって検索するものばかりだ。こういう方法で得られるデータは信頼性が低いことで悪名高い。そこで Google などは人手に頼った労働によってサーバに蓄積された画像に内容にふさわしいキーワードを付加する試みをしている。Pixsyのような画像検索専門のエンジンでも画像に付与されたメタデータは少ない。どの検索エンジンも検索はテキストでしか受け付けない。

このような「まだホンモノではない」イメージ検索エンジンに対して、Riyaはこれこそが「ホンモノの」イメージ検索エンジンだと世に問うたのがLike.comである。ちなみにLikeは「好き」ではなく「似ている」の方。Like.comの「ホンモノ」たる所以は次の点にある。

Like.com のエンジンではテキストとイメージを検索入力として受け付けるという今まで誰もやっていないことが可能になった。検索入力にイメージを受け取った場合、このエンジンはそのイメージの特徴を抽出し、他の画像と比較して検索する。 “visual signature”(シグネチュア)と呼ばれる抽出された特徴は、元の画像を数学的に処理して得られる 10,000 種類の指数である。この指数同士が十分な数一致した場合、Like.com はこれらが似た画像だと判断する。

技術的なポイントは“visual signature”(シグネチュア)という「イメージの特徴」にある。その数学的に処理して得られるとされる10,000種類の指数とは、人間が識別可能な画像の諸特徴であるはずで、いわばそのひとつひとつの「タグ」が大きなシソーラス(類似体系)として設計済みなのだと推測される。その「中身」が知りたいものだ。企業秘密だろうな。

Like.comの画像データベース中の全画像のひとつひとつには10,000種類の小さな「特徴」、「タグ」がつけられていると考えられる。そして、Like.com のエンジンは、入力された「裸のイメージ」から瞬時に10,000種類からなる“visual signature”(シグネチュア)を私には分からない方法で「抽出」し、その結果を画像データベースと照合して「指数同士が十分な数一致した」、つまり「like(似た)」画像を喚び出す、という仕組みだ。

Like.comの現状は、

たとえばウェブでなにか画像を見たとする。たとえば左の写真で、パリス・ヒルトンの着けている腕時計の画像をイメージ検索に入力したとする。するとLike.com はそれによく似た時計のイメージを検索結果として返してくる。

Like.comはもちろん「テキスト入力」も受け付けるので、

もしテキスト検索で「つま先の尖った茶色のブーツ」と入力すると、 Like.com はこのテキストからそれに対応する画像シグネチュアの指数を生成し、似たイメージを検索する。

肝心の検索範囲はというと、

サービスは米国時間11/8にスタートしたばかりで、現在のところ検索できるのは靴、ジュエリー、ハンドバッグ、衣類に限られる。

しかし、これだけでも、馬鹿にできないサービスであり、

これらの当初のカテゴリーだけでも現実世界での消費者が好みによって選択購入する支出の非常に大きな 部分を占める。それぞれの検索結果に Like.com はその商品の購入先へのリンクを挿入する。Like.comは実際にその商品が売れた場合に[アフィリエイト]収入を得ることを希望している。

また、近々、

来月かそこらには Like.com はイメージアップローダあるいはイメージ処理ツールバーというキーとなる機能をローンチする予定だ。アップローダでイメージを Like.com に送って類似のイメージを検索する。あるいは、もっと簡単に、ツールバーを利用してウェブ上で発見した任意のイメージを検索入力として指定する。どちらの 場合でも Like.com はそのイメージに類似したイメージを検索結果として返す。

画期的なイメージ検索技術の研究開発力とそれを応用して有望なWeb 2.0的サービスを立ち上げるビジネスセンスを両立させているあたりは流石だと感じた。

私が一番関心があるのは、イメージ検索エンジンのコアに関わる“visual signature”(シグネチュア)の設計部分である。

Like.com では検索カテゴリーを将来拡大していくとしている

現在はまだ「靴」、「ジュエリー」、「ハンドバッグ」、「衣類」の四つのカテゴリーしかないようだが、同様の技術が「商品」という上位カテゴリーをさらに超えて「世界」にまで広がれば、そして例えば「植物」カテゴリーの属性となる“visual signature”(シグネチュア)がうまく設計できれば、私が欲しいと思っているような画期的な植物図鑑さえできるだろう。

それにしても、数学的処理以前に、そもそも基本的に色と形であるイメージの特徴を具体的にはどのように分析しているのか非常に興味がある。Riyaはもともと「人間の顔の認識に焦点を合わせた画像技術」を開発している会社だそうだから、かなり細かい分析ノウハウを蓄積しているだろう。でも、もしかしたら、それでは、例えば、植物画像の特徴抽出には向かない可能性があるかな。