少しのコツで機械翻訳の精度をアップ!プレエディットとポストエディット
こんにちは、かおりちゃんです。
文章を一瞬で翻訳してくれる機械翻訳。ニューラル翻訳の登場で精度も飛躍的に上がり、大まかな内容を把握するためにはとても便利ですが、そのまま使用するのはまだまだ注意が必要です。機械翻訳の訳文は完璧ではなく、読みづらさや誤訳、特有のエラーなどがあるためです。
そんな機械翻訳ですが、ちょっとしたコツで訳文の精度をアップして、より正確な翻訳ができるかもしれません。
今回は、機械翻訳の精度をアップするコツや、機械翻訳の注意点について解説します。
この記事でわかること
- 機械翻訳には不得意な文書の種類がある
- 機械翻訳の精度を上げるプレエディットとポストエディットとはなにか
- 機械翻訳で注意すべきポイント(特有のエラー)
機械翻訳に向いている文書・向いていない文書
そもそも機械翻訳には向いている文書、向いていない文書があります。
契約書、マニュアル、特許書類など、型や言い回しが決まっている文書は比較的精度が高いですが、一方で論文や文献、キャッチコピーなど、読み物的な要素やクリエイティブな要素がある文章は苦手。細かいニュアンスや前後の文脈などを読み取れず、不自然だったり誤訳になってしまう可能性があります。
また、一文がとても長い文章などは機械翻訳では正確に読み取るのが難しく、解釈を誤ったり、訳すのを諦めてそのまま訳抜けになってしまう場合もあります。
一文がやたらと長い文章は機械に限らず人間でも読みづらいですよね。
事前に編集!プレエディット
機械翻訳の精度をアップする方法として、事前に原文を訳しやすいように編集する「プレエディット」という手法があります。
プレエディットをすることで機械翻訳が原文を理解しやすくなり、訳文の精度が向上します。ただし、早いことがメリットである機械翻訳に対して、プレエディットにどれだけ時間を使うのかということは事前に検討しておく必要があります。
徹底的にやるとかなりの時間がかかるため、どこまでやるのかという作業範囲を決めておくと良いですよ!
プレエディットは、具体的には以下のような作業を行います。
- 主語や目的語を補う
- 長過ぎる一文を短く区切る
- よけいな改行を取る
- 慣用句などを避ける
- ひらがなはなるべく漢字にする
1つずつ解説していきます。
主語や目的語を補う
日本語は主語や目的語が省略されがちです。そのまま機械翻訳にかけると、省略されている箇所を誤った語で補完されてしまったり、英語として分かりにくい表現、または誤訳になってしまうことも。省略されている主語や目的語を補うことで、精度が上がる可能性があります。
<例>
明日以降は予定が空いています → 彼は明日以降は予定が空いています
長過ぎる一文を短く区切る
一文が長過ぎると訳文として不自然だったり、誤訳になってしまう危険があります。また、長文は丸々翻訳訳されずに訳抜けになってしまう場合もあるため、そのような文章は事前に短く区切りましょう。
<例>
今回の内容は非常に複雑で対象者には注意点が理解しづらく、多くの項目でミスが続出したため、期待していた成果は出せなかった。
→
今回の内容は非常に複雑で対象者には注意点が理解しづらく、多くの項目でミスが続出した。そのため期待していた成果は出せなかった。
不要な改行を取る
原稿によっては、レイアウトを調整するために文章の途中で意図的に改行している場合があります。しかし文章の途中に改行があると機械翻訳はそこで文章が終わっていると判断するため、ぶつ切りに途切れた原文を翻訳することになり、意味が通らない訳文になってしまいます。
機械翻訳にかける前には、こうした不要な改行はすべて取り除きましょう。
慣用句などを避ける
「舌が回る」「ほっぺたが落ちる」のような慣用表現は機械翻訳では理解できない場合が多いので、通常の表現に置き換えます。
<例>
初めての給料は雀の涙だった → 初めての給料はとても少なかった
ひらがなはなるべく漢字にする
漢字に直せるひらがなはなるべく漢字に直しましょう。
同じ読み方でも複数の漢字がある場合、文脈を読み取れない機械翻訳では判断を間違えて誤訳になってしまう可能性があります。
<例>
しよう(使用、仕様、試用、私用 など)
後で編集!ポストエディット
ポストエディット(Post Edit = PE)は、機械翻訳の訳文を人間がチェックし、エラーや不自然な箇所を修正する手法です。
どこまで手を入れるのかによって、ライトポストエディットとフルポストエディットの2種類に分かれます。
ライトポストエディット=「読めればいい」という程度で、「てにをは」などの簡単な修正に留めます。
フルポストエディット=機械翻訳の訳文を活かしながら、人間による翻訳と同等の品質まで修正を行います。
ポストエディットにかかる時間は訳文の質に大きく左右されます。原文が良くなかったり、機械翻訳が苦手なタイプの文書だと機械翻訳の品質も低く、場合によっては一から人間が翻訳をやり直したほうが早い、ということも。
プレエディットの際と同じく、「どこまで手直しをするのか」という作業範囲を事前に決めておくと良いでしょう。
「どこまで修正するか」は翻訳の目的によって変わりますよね。
機械翻訳の注意点
機械翻訳には、注意すべき特有のエラーが発生することがあります。
- 文章単位で訳抜けしてしまう(とくに長文の場合に多く発生する)
- 数字や略語が別のものに置きかえられる
- 表記の統一ができず訳ブレが発生してしまう。
- 原文にない文言が突然訳文に追加されてしまう など
ニューラル機械翻訳は精度が高く、自然な訳文を出力するため、サッと読んだだけではこれらのエラーに気づけない場合があります。そのため、機械翻訳後の訳文は必ず人間の目でしっかりチェックしましょう。
品質の確かな人間翻訳をご希望の場合は
機械翻訳の精度を上げるには、プレエディットやポストエディットが有効な場合もありますが、これには手間とノウハウが必要です。はじめから品質の高い訳文をご希望の場合は、最初からプロの翻訳者による人間翻訳を依頼しましょう。
Word Connectionは日本語を軸に、欧州言語を中心とした翻訳とローカライゼーションサービスを展開する翻訳会社。各分野において高い専門性をもつ翻訳者を揃えており、ライフサイエンス、IT、法律文書、技術マーケティング文書など、幅広い分野に対応可能です。
プロの翻訳者による品質の確かな翻訳をご希望の場合は、Word Connectionにお問い合わせください!
この記事へのコメントはありません。