自動翻訳

およそ8ヶ月前にGoogleの翻訳ツール「英語から日本語へBETA」を試したことがあった。
http://www.google.co.jp/language_tools?hl=ja
意地悪のつもりは全くなかったが、構文的にも語彙的にも難度の高いものを試した。

THE ISLAND CAME OUT OF THE OCEAN as isolated isles, then the keys became mountains and the shallows, valleys. Later the islands joined to form a great island, which soon became green where it wasn't golden or reddish. Islets continued to emerge beside it; now they were keys and the island turned into an archipelago: a long island beside a great round island surrounded by thousands of islets, isles and even other islands. But since the long island had a defined form, it dominated the group, and nobody has seen the archipelago, preferring to call the island "the island" and to forget the thousands of keys, isles, islets, that border it like clots of a long green wound. There's the island, still coming out between the ocean and the gulf: there it is. . . .
(G. Cabrera Infante, VIEW OF DAWN IN THE TROPICS 1974)

2005.10.17の自動翻訳結果:

島は隔離された島として海洋から, それからキーなった 山とshallows すなわち谷に出た。大きい島を形作るために後で島 は結合したすぐに緑にところでそれ金か赤味がかったwasn't なった。小島はそれの側に現れ続けた; 今それらはキーと archipelago に回った島だった: たくさんの小島, 島及び他の島 によって囲まれる大きい円形の島の側の長い島。しかし長い島に 定義された形態があったので, それはグループを支配し, だれも 島を" 島" と呼ぶことを好むarchipelago 見, たくさんのキーを , 島忘れるためにすなわち小島, それに接する長い緑の傷の血塊 を好む。There's 島すなわち海洋と湾の間に静かな来ること :そこにそれはある。。。
(熱帯地方1974 年の夜明けのG. Cabrera Infante, 眺め )

その時の「感想」:
上の自動翻訳の結果をみると、ちょっと複雑な英語文の構文解析に失敗し、したがって日本語文への変換もできていない。語彙に関しては、いわゆる基本語彙からはずれるような、keys[低い小島,州島,サンゴ小島]やshallows[浅瀬,洲(す)]やarchipelago[群島,多島海]が当該ツールの辞書には載っていないことが分かる。また短縮形wasn'tとThere'sも載っていない。他方でclotsは「血痕」と難しい日本語に変換されているが、これはclots=血痕としか辞書には載っていないということである。違う文脈で「群れ」あるいは「ばか」と出てほしいときにも「血痕」と出て来ることは確実である。それでもなお、「ここ」まで日本語に置き換えられていれば、そこから先の翻訳行程はかなり短縮されることも確かである。現行の自動翻訳サービスは翻訳精度の低さを露呈していると見るのではなく、そもそもいかに翻訳というものが複雑なプロセスを含んでいるかということをわれわれに教えてくれていると見るべきである。結局はもし必要ならわれわれ自身が翻訳という奥深い森あるいは群島、多島海archipelagoの複雑な航路に入り込むべきなのであり、自動翻訳はその際のガイド役、灯台役を勤めてくれるありがたい存在だと考えるべきである。
同じ英文をおよそ8ヶ月後の今日、同じツールで試した結果:

島は隔離された島として海洋から出た、 それからキーは山およびshallowsになった、 谷。 後で島は金またはでなかったところですぐに緑になった大きい島を形作るために結合した 赤味がかった。 小島はそれの側に現れ続けた; 今それらはキーおよび多島海に回った島だった: a 囲まれる大きい円形の島の側のロングアイランド たくさんの小島、島および他の島。 しかしロングアイランドに定義された形態があったので、それは支配した グループおよびだれも島を「島」と呼ぶことを好む多島海を見ないし、たくさんのキーを、島忘れるために、それに接する小島、長い緑の傷の血塊を好む。 出て来島、海洋と湾の間に静かな出て来ることがある: そこにそれはある。 …。 (g. Cabrera Infante、熱帯地方1974年の夜明けの眺め)

上の8ヶ月前の「感想」でも間接的に触れているように、自動翻訳の基本システムは構文変換と語彙変換から成るのだが、英語と日本語の構文上の大きな違い、語彙ネットワーク間の絶望的に大きな隔たりが、日英(英日)間の自動翻訳精度向上にとっては容易には架橋しがたい深い溝になっている。この8ヶ月間にこの翻訳ツールは「進化」したのか否か。自動翻訳サービスに精度の高い翻訳を高望みしてしまう人にとってはこの「結果」はまるで進化していないと映るだろうが、よく見てみると着実に進化していることが分かる。まず形式的に日本語に置き換わっている箇所は増えているので、辞書はある意味で充実したと言えるし、構文の変換に関しても、日本語の構文への対応が少し改善されている。ちなみにこの翻訳ツールは英語を軸に、ドイツ語とラテン系言語(フランス語、イタリア語、ポルトガル語スペイン語)との間の翻訳ツールは正式版だが、日本語をはじめ、それ以外はすべてBETA版である。
私の考えでは、翻訳とは人間が行う知的活動の中で最も複雑かつ深遠なもののひとつであり、しかも例えば英語と日本語のようにその由来と形成過程に大きな隔たりのある言語間では、その複雑深遠さは極大に達する。つまり課題としては人工知能の実現と同レベルの困難さが自動翻訳システムの開発にはある。だから、自動翻訳の「結果」に落胆を表明することは、ロボットに「表情」がないと文句を言うようなものである。この教訓は、グーグルが目指すゴールを無効にはしないが、少なくとも「翻訳」に対する私たちの安易で浅薄な理解を戒めることにはなる。すなわち、私たちはプロの翻訳家の仕事レベルの結果を自動翻訳サービスに要求してしまいがちだが、それは翻訳の最高レベルの成果であって、自動翻訳が示しているのはプロではない素人の私たちの翻訳プロセスの一段階なのである。つまり、自動翻訳は私たちの翻訳プロセスの鏡なのである。見方によっては詩編のようにも見える上の日本語訳に興味を覚えない人は、翻訳については何も分かっていないと言えるだろう。