外国人名対訳辞書(自動編纂)に対する微かな危惧


紬(Tsumugi) - 外国人名対訳辞書(自動編纂)で「Le Corbusier」を検索した結果の一部。


これは、名古屋大学・佐藤理史研究室が開発した、外国の人名、地名、組織名、製品名など固有名詞の辞書や特定の分野・領域で使われる専門用語の100%自動編纂された辞書である。「紬クローラー」と名付けられたシステムが、 約5か月に渡ってウェブから収集した人名対訳集合を、クリーニングすることによって作成されたという。「クリーニング」の中身は不明。本辞書が対象とする人名対訳は、ラテン文字で表記される原綴とそのカタカナ訳である。その設計方針と目的については次のように述べられている。

外国人名のカタカナ訳の作り方には、厳密な規則は存在しません。基本的には、原綴の発音を、日本語の音で近似して表記します。しかし、この近似は一意には定まらないため、複数のカタカナ訳が生まれます。

多くの場合、時間の経過とともに、そのうちのいずれかが社会に定着して代表的なカタカナ表記と認知されるようになり、他のカタカナ訳は異表記の地位に追いやられて、しだいに姿を消していきます。しかしながら、まれに、複数のカタカナ表記が生き残り、それらが使われ続けることもあります。

複数のカタカナ訳がある場合、そのうちのどれを用いるかは、文章の書き手が決めることです。いちばん良く使われているカタカナ訳を用いるという考え方もありますし、より原語の発音に忠実なカタカナ訳を用いるという考え方もあります。そこには、正解という概念は存在しません。

このような考えに立つと、人名対訳辞書は次のような役割を果たすべきだという考え方が導かれます。

人名対訳辞書は、次の2つの情報を提供すべきである。

(1)その人名に対して、すでにカタカナ訳があるかどうか
(2)複数のカタカナ訳がある場合は、それらの使用や定着の度合


本辞書は、この2つの情報を提供することを目的として設計された。

 「まえがき」より


また、このような設計方針と目的の背景には、辞書に対する、少なくとも対訳部分に対する、「100%正しい」という幻想を払いたいという意図があることも、次のように述べられている。

これまでの人間の手によって編纂された対訳辞書は、十分に定着した既訳のみを提供してきました。そのため、辞書に収録されたことが定着の証明となり、それがあたかも正解のように扱われてきました。「ここに書かれていることは100%正しい」という幻想を抱かせうるものが「辞書」であり、そこに辞書の本質があったということができると思います。

自動編纂による辞書は、そのような幻想を生み出すことを目指していません。が、しかし、非常に品質の高い辞書が自動編纂できるようになれば、結果的に、そういう幻想が生まれてくるのかもしれません。

 「まえがき」より



なるほど。たしかに、冒頭で試した「Le Corbusier」のように、カタカナ表記の選択に迷うことは少なくないので、この辞書によって既存の表記や複数の表記の併存と各使用頻度などを知ることは、一定程度役に立つだろう。しかし、微かな危惧がある。というのは、この対訳辞書の使用が広まれば、特に複数のカタカナ表記が併存する場合に、ある時点でそれが提供する情報、主にヒット数や推定数の多さが、その後のカタカナ表記の選択に偏向を及ぼす可能性が大きく、その結果、複数のカタカナ表記の内の一つだけが「生き延び」、他が「滅びる」かもしれない過程を加速することになりかねないと思われるからである。


何が言いたいかというと、複数のカタカナ表記が併存することは、翻訳の本質的な困難を指し示す重要な指標のひとつであり、あえて統計的な処理の結果に基づいた情報を提供することは、そこに選択の過度の圧力をかけてしまいかねない。そのようなシステムには微かな違和感を覚えるということである。もちろん、使い方次第という面はある。しかし、この場合、情報の提供は決して中立には働かず、偏りを生むのではないかという微かな危惧がある。杞憂かもしれないが。