青空検索エンジン

そもそも画像を検索する「必要性」はどこにあるのか、という大問題は棚に上げて、

もう5ヶ月前の記事だが、jm@fooさんの画像検索の実験がある意味で面白い。
「2006年08月16日 青空サーチエンジン
http://minken.net/mt/archives/000562.html

jm@fooさんは、ULSE(Urban landscape search engine)が、「風景サーチエンジン」の名に値しない、つまりキーワード検索しかできないことに対して、やはり本物の画像検索を試作したいと思い立ち、かつ「人間がタグ付けしてフォークソノミー」という「今風」にも対抗して、「ここは機械任せの力業を見てみたい」と思い切って、「ULSEに投稿された過去の画像のうち手元にバックアップがあった3000枚あまりについて、総当たりで相互に画素の平均絶対誤差を取り、誤差が小さいものから順にリストアップする」システムを作ったという。それが、これ。
http://ld.minken.net/cmp/

そのシステムの肝は、「画素の平均絶対誤差」の小ささ、すなわち「両画像の同じ位置の画素のRGB各色について数値の差を求め、それを全画素数分足し集めて画素数で割る」という「差の少なさの平均」に着目した発想である。その結果は、

場合によってはなんとなく同じような画面構成の絵が集まってくることがあるのが面白い。同じ位置の画素同士の比較をしているとはいえ、結局全画素について平均を取ってしまっているわけで、そんなザックリとした大づかみな値で構図が似てくるのがなんとも不思議

というわけで、「割とうまくいった例」が12個挙げられている。その最後の例が「青空」で、

まあ、うまくいかないことのほうが多いくらいだけど、確実にマッチするのは青空ということで、風景サーチエンジンとまではいえないにしても、青空サーチエンジンとなら名乗っても構わないかも

と「落ち」がついている。

私がある意味で面白いと思ったのは、本物の画像検索は非常に難しい、一筋縄では行かないものだということを大前提にした上で、

「画像検索」については、これまでに何度か書いてきた。

http://d.hatena.ne.jp/elmikamino/20061115/1163583431

  • 「search or explore ?:retrievrの場合」

http://d.hatena.ne.jp/elmikamino/20061209/1165686564
(特に後者のコメント欄では、fuzzy2(id:fazzu2)さんの詳細な技術的なコメントも読める。)

「似ている」ものを探しだす基準として「違い」に目をつけているところだった。似ているということは違いが少ないということである。類似性や同一性について考える場合に、「似ている」ことや「同じ」ことに猪突猛進するのではなく、違いが少ない、違いがない、という回り道をする発想は貴重だと感じた。これは他の場面でも言えることだとも感じる。

そういえば、ライプニッツという微積分を発明し人工言語のアイデアも構築した偉大な数学者兼哲学者は、「不可識別者同一の原理」ということを主張した。同じということは識別できない、違いが分からないということである、という意味である。

意識の上では「似ている」、「同じ」が明晰判明な基準として働いているように思われたりするが、無意識のレベルでは、つまり脳では、どれくらい「違い」が少ないかという差異、差分の膨大な計算が行われているはずだと感じる。Like.comやretrievrの開発者たちにとってもそれは大前提だろうと思う。

別の言い方をすれば、言語上の「似ている/違う」という区別の下では「より多く似ている〜より少なく似ている」という連続的な直観が働いていて、さらにその下では「より少なく違う〜より多く違う」という連続的なニューロ計算が働いていると言えるのではないか。

毎朝見る度に藻岩山は違う。同じなのは「藻岩山」という名前だけだと言いたくなりもする。もちろん、「藻岩山」というインデックスには様々な言語的知識(記述)の束がぶら下がっている。少なくてもその地理的、地勢的、景観的諸特徴から、名前がなくても「それ」は同定できるだろう。それに、名前(の同一性)がなければ「それ」の違いを有意味に語ることもままならない。

他方、
http://ld.minken.net/cmp/#Shared/030817_1843~01.jpg
を見ると、「カエル」と「人間」という名前の違いを超えて、画像としての違いの少なさ(類似性)を私は確かに感じている。面白いと感じる。だから、「幽霊」だっていくらでも「見える」のが人間なのだろうと思う。

ちなみに、「青空検索エンジン」の開発はその後中断したままのようです。