「良い翻訳」を定義するにはー機械翻訳と翻訳学の接点

この記事の概要
ニューラル機械翻訳がその流暢性が向上している昨今、「良い翻訳とは何か」について考える必要があります。そのヒントが翻訳学には隠されています。例えば、「スコポス理論」は翻訳の目的に則した訳文が良い翻訳であると定義しています。このような知見は機械翻訳の適切な使用、そしてシステム開発に役立つかもしれません。

どうも、平岡裕資(@hyusuke59)です。
前回は僕自身の失敗だらけの留学体験についての記事を書きました。

前回の留学経験を語った記事にもあった通り、英語が得意と自負していた僕はプロの翻訳者を目指していました(今でもそうです)。しかし、三年次から卒論研究を進めていくうちに、翻訳を研究の対象として学ぶことも好きになってしまいました。

その中で特に興味を惹かれたのは「機械翻訳」です(もともと、ガジェット好きだったこともあり、テクノロジー全般に興味があります)。根本的には0か1の二つの選択のみを行う機械に、複雑な言語を理解させるという取り組みは困難に聞こえたとともにとても魅力的に感じました。特に近年の機械翻訳は流行りのニューラルネットワークを用いて、人間に近い形で言葉の意味を定義づけようとしています。

一方で、これまでの翻訳研究に興味が無かったかというと、そうではありません。翻訳学の文献を漁り、実際に翻訳をすることで、言葉とコミュニケーション1ここでは話すだけでなく、書くことを通じた対話も含みますが、いかに複雑で、気まぐれで、面白いのかを垣間見えることができたからです。

今回は、この両者の関係性、いわば「機械翻訳と翻訳学の接点」について、書いていきます。

ゆうすけ

Share Study編集部。機械翻訳を代表するIT技術が翻訳のあり方を変えつつあります。そのような拡張された時代において見えてくる言葉の本質を探求しています。「あそび」としての学問を目指しつつ、謙虚に生きていきたいです。

機械はどんな翻訳をするのか

ニューラル機械翻訳の仕組み

ニューラル機械翻訳とは、文字通り、近年流行りのニューラルネットワークのディープラーニングを応用した自動翻訳システムです。みなさんがよく使っているであろうGoogle翻訳も同様の仕組みです。

このニューラル機械翻訳は翻訳業界でも注目を集めつつあります。その理由は、デリバリー面とコスト面にあります。つまり、翻訳速度が早く(デリバリー面)、人間が翻訳するよりも安価で済む(コスト面)のです。そんな機械翻訳の実用化を目指して、研究が盛んに行われています。

従来の文法ルールに従うシステム(ルールベース機械翻訳)や、統計処理によって翻訳するシステム(統計的機械翻訳)と異なり、ニューラル機械翻訳は、擬似的に意味を理解していると言われています。どういうことかというと、機械学習をすることで言葉の意味を数値で表すこと(分散表現)によって、機械が人間と同じように言葉を操ることを目指しているのです。

そのような仕組みを持つニューラル機械翻訳は従来のシステムよりも格段に精度が良くなったと言われており、およそTOEIC900点程度の英文作成能力があるという報告もあります2みらい翻訳(2017)「TOEIC900 点以上 英作文能力を持つ 深層学習による機械翻訳エンジンをリリース」, [online]https://miraitranslate.com/uploads/2017/06/2d5778dcdee47e4197468bc922352179.pdf(参照2019-4-16)

自動翻訳文の特徴

では具体的にニューラル機械翻訳はどのような訳出を行うのでしょうか。

ある報告3中澤 敏明(2017)「機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理」情報管理, 60(5), pp. 299-306によるとニューラル機械翻訳の最も精度が向上した面は「流暢性」と言われています。

例を見てみましょう。自動翻訳文に文法的な間違いはあまり見られず、自然な日本語が出力されています。

“Share Studies” is a platform for “academics” who seek to get a gist of undiscovered, learning from each other.
「シェアスタディーズ」は、お互いから学ぶことで、発見されていないという要点を探そうとする「学者」のためのプラットフォームです。

(Google 翻訳)

例をみるともう一つわかることがあります。それは訳文がすべて直訳よりということです。ここでいう「直訳」というのは、その翻訳を何のために行うのか、という視点が抜けている訳文のことを指します。

例えば、一つ目の例は、原文がどのような内容なのか、大体は理解できます。しかし、この文が、「ホームページが開くとまず最初に目に入るようなキャッチコピー」だとしたらどうでしょうか? もう少し気の利いた文句の方が、下にスクロールしてみようと思う人が増えそうです。つまり、このような自動翻訳は原文が何を指すのかということは伝えられますが、「言葉の機能」までは再現できないことが多いのです。

また、ニューラル機械翻訳は「訳抜け」や「重複訳」が起こることも知られています4中澤 敏明(2017)「機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理」情報管理, 60(5), pp. 299-306。訳抜けとは、文字通り、原文にある要素が訳文ではぽっかり抜けてしまっていることで、重訳は反対に同じ要素を繰り返し訳出してしまう現象です。以下の例を見てみましょう。

Share Studyは学び合いの「文化をつくる」ことをテーマに活動しています。
Share Study is based on the theme of “making culture” of learning.

(Google 翻訳)

重要な要素であるはずの「学び合い」が単純に”learning(学び)”と訳され、「互いに学ぶ」というニュランスが訳抜けしています。また、ニュアンスだけでなく、要素がまるまる抜けてしまうことも少なくありません。

まとめると、ニューラル機械翻訳は、流暢性が高いために、その訳文は一見すると高品質ですが、よく見ると訳抜けや重複訳を含むことがあります。そのため、安易に使用すると危険な場合があるのです。

つまり、ニューラル機械翻訳を適切に使うためには、訳文の「正確性」を重視しなければなりません。それでは、その「正確性」とはどのように定義すればよいのでしょうか? そのヒントが翻訳学に隠れています。

翻訳学による「正確性」の定義

翻訳学の対象

翻訳はよく聞くけれど、その学問分野である「翻訳学」はあまり馴染みがないかもしれません。過去の代表的な学者を見ると、その多くが言語学者であったことから、元々は言語学の一部の研究分野として扱われてきたと推測できます。

当学問分野で研究の対象となるものはこれまで大きくわけて二種類ありました。一つは「原文と訳文の違いを比較する」というもの、二つ目は「訳文とその訳文を必要とする社会・文化との関係性を分析する」といったものです。

また、翻訳学のマップというものもあります5Toury. 1995. Descriptive Translation Studies and beyond, Amsterdam and Philadelphia, PA: John Benjamins.

ホームズによる翻訳学の「地図」(『翻訳学入門』から引用)

これは、翻訳学が対象とするものを記述した枠組みです。大きくわけて、⑴翻訳という現象の記述(記述的翻訳理論)⑵そのような現象を説明し予測するための一般的な原理の確立(翻訳理論)に分けられます6マンデイ, ジェレミー(2009/2012)『翻訳学入門』鳥飼玖美子監訳, みすず書房.

目的が翻訳のすべてを決める

さて、この中でも機械翻訳を語る上で、重要になるのがフェルメール7Vermmer, H. 1989/2004. Skopos and commission in translational action, in L. Venuti (ed.) (2004), pp. 227-38.が提唱した「スコポス理論」と呼ばれるものです。スコポスとはギリシャ語で「目的」を意味し、翻訳の目的によってどのように訳すのかが決定されるという主張が主な理論です。

この理論は、先ほど述べた「直訳と意訳」、そして「正確性」も説明できます。「直訳」は「スコポスを考慮しない訳文」で、意訳はその反対です。また、「正確性」は訳文がスコポスにどれだけ則しているかの程度である、と言い換えることができます。

では、スコポスとは具体的に何なのでしょうか?それは、訳文がどのような位置付けを持つかによって決定されます8マンデイ, ジェレミー(2009/2012)『翻訳学入門』鳥飼玖美子監訳, みすず書房.。つまり、「誰が」「何のために」「どのような」訳文が「いつまでに」必要なのか。これらの要素があって初めてスコポスの輪郭が見えてくるのです。

これらを考慮した翻訳を行えるのは、プロの翻訳者のみといって良いでしょう。
では、はたして、アマチュア翻訳者や学生には難しいものを、機械翻訳は訳せるのでしょうか?

ここで、先ほどの例をもう一度見てみましょう。

“Share Studies” is a platform for “academics” who seek to get a gist of undiscovered, learning from each other.
「シェアスタディーズ」は、お互いから学ぶことで、発見されていないという要点を探そうとする「学者」のためのプラットフォームです。

(Google 翻訳)

この訳文が前述の通り、ウェブサイトのキャッチコピーとして使用されるとしてみましょう。より具体的には、「サイト管理者である、としちるが」「ウェブサイトを開いたオーディエンスがさらに詳細を読みたいと思うように」「サイトの特徴をうまく表して説得力のある」訳文が欲しいと仮定してみます。すると以下のように修正できるかもしれません。

“Share Studies” is a platform for “academics” who seek to get a gist of undiscovered, learning from each other.
“Share Studies”は、学び合い、まだ見ぬ何かを追い求める「アカデミスト」のためのプラットフォームです。

(筆者による訳文)

“Learning from each other”はShare Studyの重要なキーワードである「学び合い」を使用し、機関内の学者だけでなく、所属に関係なく学問に関心のあるすべての人を指すように”academics(学者)”を「アカデミスト」とカタカナで表現しています。

しかし、この訳文が「5分後までに」必要だとしたらどうでしょう。ここまで考える時間はなく、5分以内で考えられる最高の訳文を作成するしかないかもしれません。また、上手にスコポスを設定するには、訳文を必要とする者と翻訳を行う者の円滑なコミュニケーションが必要になってきます。

このようにスコポスを先に決定しておくことで、何を直すべきか・直すべきでないか、場合によっては付け足すべきか、削除すべきかを検討することができます。

まとめ

ニューラル機械翻訳はその流暢性が向上した一方、一見すると見分けづらい訳抜けや重複訳という誤訳が生じる場合があります。訳文の特徴には、原文が何を指すのか大体は理解できる場合が多いものの、スコポスを考慮しない訳文を出力するために、言葉の機能はうまく訳せないようです。

そして、機械翻訳の正確性は、翻訳学の知見であるスコポス理論を借りることによって定義できます。これこそが機械翻訳と翻訳学の接点と言えるでしょう。つまり、自動翻訳文が正確かどうか、スコポスに即しているかどうか、を翻訳学の観点から判断することによって、機械翻訳を使いこなすことができたり、もしかするとさらなる精度の向上を目指したシステム開発の足がかりが見つかるかもしれないからです。

ゆうすけ
もちろん、スコポス理論が翻訳学のすべてではありません。「良い翻訳とはなにか」のヒントとなる知見は他にもたくさんあります。精度が向上し、良い翻訳を定義づける必要のある機械翻訳にとって、これらの知見は重要になってくるのではないでしょうか。

Footnotes   [ + ]

1. ここでは話すだけでなく、書くことを通じた対話も含みます
2. みらい翻訳(2017)「TOEIC900 点以上 英作文能力を持つ 深層学習による機械翻訳エンジンをリリース」, [online]https://miraitranslate.com/uploads/2017/06/2d5778dcdee47e4197468bc922352179.pdf(参照2019-4-16)
3, 4. 中澤 敏明(2017)「機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理」情報管理, 60(5), pp. 299-306
5. Toury. 1995. Descriptive Translation Studies and beyond, Amsterdam and Philadelphia, PA: John Benjamins.
6, 8. マンデイ, ジェレミー(2009/2012)『翻訳学入門』鳥飼玖美子監訳, みすず書房.
7. Vermmer, H. 1989/2004. Skopos and commission in translational action, in L. Venuti (ed.) (2004), pp. 227-38.

Share Culture

研究者向けにWebサイトの制作や学術メディア『Share Study』を運営。シンプルかつスタイリッシュなデザイン制作を得意とし、学び合いの文化を耕すことを掲げています。最安5万円からサイトを制作!学生向けに情報を整理し、研究内容をわかりやすく外部へ発信するサポートをいたします。

Writer