フォークソノミーにおける「信頼性」:美崎薫氏のアウラリー報告

美崎薫さんがMYCOMジャーナルに興味深いレポートを書いている。

(1)文化財コンテンツ管理「アウラリー」
http://journal.mycom.co.jp/articles/2006/12/19/icadl1/
(2)タグづけの限界/可能性
http://journal.mycom.co.jp/articles/2006/12/19/icadl1/001.html
(3)「ものごとに対する記述は複数あるのが普通」 - 相原助教授が語るアウラリー
http://journal.mycom.co.jp/articles/2006/12/19/icadl1/002.html


これは、国立情報学研究所コンテンツ科学研究系の相原健郎助教授が東京の国立博物館と共同で開発した「アウラリー」システムに関して、フォークソノミーの観点から積極的に評価する報告である。アウラリーそのものについては美崎さんの要を得た手際よい解説を是非お読みいただきたい。

私が興味を惹かれたのは特にアウラリーの「『成長するメタデータ』による柔軟なコンテンツ管理システム」における「成長する」と「柔軟」の中身である。

相原助教授の「アウラリー」システムのおもしろいところは、データを動的に変更するシステムであるところにある。データはタイトル(Title)と説明(Description)に構造化されていて、どちらもユーザーが追記できる。WikipediaFlickrのように、データに対するタグは、ユーザーが自由に追記することができるという。フォークソノミー的に入力したものを、コンテンツとして使うのである。コンテンツの内容が博物館の収蔵品で、解説を専門家がつければ、その説明が初心者向けでないことは容易に想像がつく。そこで、参加型のアノテーションシステムの出番となる。

博物館の収蔵品を私のような素人が見たいと思った時に、専門家がつくったタイトルや説明のリストを見せられても、どれが「見たいもの」か見当がつかないだろう。「博物館の収蔵品」は専門家にとっては「ひとつの世界」であり、その世界の秩序は専門的な分類(タクソノミー)で十分かもしれないが、素人にとってはチンプンカンプンな標識みたいなものである。もちろん、それを勉強することの大切さを忘れてはならないが、そもそもその世界に対する多くの素人の興味関心を引き出すことが、アウラリー開発者のミッションである。

そうなると、専門家にとっては確固たる秩序によって構成された唯一の世界が、実は不特定多数の素人にとってはそれぞれの世界にすぎないという哲学的真実!に直面することになる。人の数だけ世界はある、というわけだ。「論理哲学論考』のウィトゲンシュタインもほぼそう考えた。したがって、美崎さんが書いているように、

結局のところ、あらかじめ提供されたデータベースだけでは、足りないものがある。世界を記述しきることはできない。世界を記述するためには、記述する言葉をつねに追加しつづける必要がある。(中略)世界は動的に変わりつづけており、それを日々記述し続けなければ、どんな固定的なデータベースも古びて使い物にならなくなってしまう。

「あらかじめ提供されたデータベース」とは専門家があらかじめ用意した「辞書」みたいなもので、最近では「オントロジー存在論)」と呼ばれることが多い。この世界にはどんなものが存在するかを示す辞書、その中身は分類である。しかし、不特定多数の素人が主役の舞台では、そのような辞書、オントロジーはすぐには役に立たない。素人の数だけ「世界」は多様であるから、その多様性に見合った勝手な分類(フォークソノミー)の「記述」が次々と追加されていく必要がある。つまり、辞書=オントロジー=データベース自体が「柔軟に成長」していかなければならない。

ただ、すべてを素人に任せればいいというものでもないのは明らかである。

もちろん、タイトルと説明のように、構造化できるところはしておいたほうがよい。Googleに代表される全文検索はきわめて強力だが、できることはやっておいたほうがよいにきまっている。タグやシソーラス、辞書なども、用意できればできたほうがよいにきまっている。問題なのは、それはオープンエンドな問題であることにある。

ものごとに対する記述は複数あるのが普通で、内容はひとつには決まりません。それを吸収できることが重要です。内容が文化財などでは、だれが書いたかということが信頼性にもつながるので、Wikipediaのように公開で、というわけにはいきませんが、インターネットで登録すれば、どなたでも使っていただける方向で準備を進めています。(相原助教授の言)

本来的に「オープンエンド」であるフォークソノミーにおける「信頼性」をどう考えて態度決定するか。これがアウラリーのみならず、オープンソース的なプロジェクトにおける大きな問題のひとつである。