拡大法
機械翻訳の現状と実用性 2017年9月
制作


 筆者は昔 プロ翻訳家として活動 したこともありこの領域を長期間フォローしてきた。最近、新聞・雑誌・ネットなどで、機械翻訳の記事やレビューを多く見かけるようになった。「機械翻訳」は、人工知能 (AI)、ニューラルネットワーク技術の応用などにより、最近急速に進歩し実用段階に達した模様である。そこで、本ページでは以下の疑問をクリアにするための取り組みを行った。

 ① 機械翻訳はどのような状況にあるのか?
 ② 機械翻訳は全体として何ができるのか?
 ③ 実用性はどの程度か?
 ④ 最近、機械翻訳が急速に進展してきた理由は何か?

 本レポートでは自分なりの実証テストなどを織り交ぜ、調査・考察を行った。マイクロソフトなど多くの企業や団体が手がけている分野であるが、内容的には Google 関連が多くなってしまった。すべての翻訳領域で Google がリードしている状況なのでやむを得ないと思う。

   読売論点スペシアル「AI 翻訳進化 英語教育必要?」
 Google 翻訳 機能一覧表
 Google 翻訳の実力診断
 Google 翻訳はなぜ急速に精度が向上したのか
 リアルタイムAI 翻訳(実証テスト
 Word Lens を利用したリアルタイム翻訳


読売論点スペシアル「AI翻訳進化 英語教育必要?」
 
 2017年9月17日付読売新聞に表記の記事が掲載された。タイムリーで客観的、かつ、ポイントを抑えているので、当分野の状況を把握するために、記事の概要をご紹介することから始めたい。

 記事は、機械翻訳会社経営者の栄藤氏と米国人の東大教授・翻訳家トム・ガリー氏 の意見を紹介している。問題提起側の読売編集委員の服部氏は「人工知能(AI)を使った機械翻訳の進化が著しく、分野によっては大卒者並みの英語力を持っている。将来は機械でどこまでできるのか。人間は何のため、どの程度の英語力を身につければいいのか。大学で英語を教える米国人翻訳者と、機械翻訳会社の社長に聞いた」

 機械翻訳の状況について記事は次のように説明している。”1900年代、膨大な訳文のデータを使う、「統計翻訳」が生まれてから急速に進展、昨年秋には、人工知能(AI)の深層学習の技術を使った「ニューラル翻訳」、いわゆる「AI翻訳」が実用化され正確さと滑らかさが飛躍的に向上した。特に従来は難しかった和文英訳で、人間並みの翻訳が期待できるようになった。”
 
2017年9月17日 読売新聞記事
「AI翻訳進化 英語教育必要?」
部分、拡大可能)
 機械翻訳の実力について、栄藤氏は次のように述べている。(赤字は筆者強調)昨年秋、米グーグルがAI翻訳を実用化すると、翻訳を取り巻く風景がガラッと変わってしまった。これまで5段階評価で3.5だった翻訳精度が、いきなり4.5になった。5は人間と変わらない。4はちょっとおかしいが意味は通じる。3はまあまあ通じるという具合。不可能と思われていた翻訳精度が一気に達成された。

 栄藤氏は続けて、さらに国産の驚異的な機械翻訳システムを紹介している。国の研究機関・情報通信研究機構(NICT)と同氏が社長をしている「みらい翻訳」の共同研究の成果として、2017年6月、驚くべき能力を持つAI翻訳システムを完成したという。ビジネス会話の和文英訳なら、TOEIC スコアで900点の人の能力を超えているそうだ。

 同氏は、
「機械翻訳では意味は伝わるが人間の気持ちが伝わらない」と言っている。私も同感である。対人で自分が伝えたいことを満足に言えないこともあるくらいである。日本の場合、相手が先輩か後輩かで言い方まで変わってくるのが普通だ。双方の国の伝統・文化・考え方、そして、まわりの雰囲気、状況によって記述や話し方まで変わってくることが多い。機械翻訳ではこのような微妙なニュアンスまでは伝えきれないのだ。このことを認識して機械翻訳は使いこなすべきかと思う。

Google 翻訳 機能一覧表
 

 
Google が手がけている翻訳領域は多方面にわたっている。文章の翻訳、音声の翻訳、リアルタイム翻訳(通訳)、手書き文字の翻訳、カメラの映像に写った文字のリアルタイム翻訳などがある。考えられる限りの分野を網羅していると思う。しかも、全世界の言語に対応するか、対応しようとしている。

 本来、国際連合あたりがやるべき仕事を1企業が無償で世界中に普及させているのだから、グーグルは国連以上の仕事をしている。Googleはノーベル平和賞に値する業績を残していると私は考えている。むしろ、国連もこのような有意義な仕事を手がけるべきである。

 それにしても、検索領域のポータルサイトとしてスタートした Google が、検索・地図・翻訳など多方面にわたる赫々たる実績を残してきたことについて驚きを禁じ得ない。私などは不勉強で、たかが検索・・と思っていたが、これをベースにしたビジネスモデルを打ち立て、この収益を使って基本的には無償のサービスを提供してくれるとは想像だにしなかった。しかも、クラウドデータベースに蓄積されている検索情報が翻訳精度のアップにも役に立っているというのである。

 翻訳の基本アルゴリズムが従来のルールベース翻訳から統計翻訳方式に革新され、加えてディープニューラルネットという手法を積極的に活用した翻訳方式 が確立されたことによって翻訳精度が向上した。また、莫大な量の翻訳情報がクラウドデータベースに蓄積されたことによって、流暢で精度の高い翻訳結果が得られたのである。ということは、多くのユーザーが翻訳機能を多く利用すれればするほど翻訳精度が向上することになり、Google の有利なポジションはますます高まる算段になる。

Google翻訳 機能一覧 
入力により 103 言語間の翻訳が可能
タップして翻訳: アプリ内のテキストをコピーすると翻結果が表示される。
オフライン: インターネットに接続できない場合でも翻訳可能(59 言語に対応)
リアルタイム カメラ翻訳: カメラを使ってリアルタイム翻訳(38 言語に対応)
カメラモード: テキストを撮影して翻訳。より高精度な翻訳が必要な場合に最適(37 言語に対応)
会話モード: 音声入力で 2 言語をリアルタイム翻訳(32 言語に対応)
手書き入力: キーボードを使わずに文字を手書きして翻訳可能(93 言語に対応)
フレーズ集: もう一度見たい翻訳にスターを付けて保存(全言語に対応)

 Google 翻訳の実力診断
  
 
Google 翻訳の現実サイト (クリック)

  手持ちのPCから Google 翻訳サイト (上の写真)にアクセスし、日本語の文章問題を英語に翻訳させ、その実力を探ってみた。結果は全体としてまともな英文であったが、問題として与えた日本語の文章の一部に、主語がない文章があったため、結果の一部に誤訳が発生した。主語を付加して再度翻訳させたら結果オーライとなった。以下、その過程を追ってみる。

 ステップ ① Google翻訳に日本語の問題を与える
   
文章は読売プレミアム[論点スペシャル] AI I翻訳進化 英語教育必要? からお借りしました。
 問題  人工知能(AI)を使った機械翻訳の進化が著しく、分野によっては大卒者並みの英語力を持っている。将来は機械でどこまでできるのか。人間は何のため、どの程度の英語力を身につければいいのか。  

 ステップ ② 英文への翻訳結果
 結果 The evolution of machine translation using artificial intelligence (AI) is remarkable, and depending on the field, it has English ability comparable to college graduates. How far can we do with machines in the future? For what purpose do humans have, how much English ability should they acquire?
 
 ステップ ③ 英文の翻訳結果を問題として与え、逆に日本語に戻するテストを行ってみた。
 結果 人工知能(AI)を用いた機械翻訳の進化は目覚しいものであり、分野によっては大学卒業者に匹敵する英語力があります。 将来、マシンとどのくらいの距離を置くことができますか? 人間はどのような目的のために、どれくらいの英語能力を身に付けるべきですか?

  ステップ②の赤字の部分の翻訳結果が誤訳。つまり、ステップ③で分かるように、マシンとどのくらいの距離を置くことができますか?」は明らかに誤訳であることが分かる。
 そこで、原文に主語を加えた問題に修正、再び英文翻訳を試みた。赤字部分が修正箇所。

 ステップ ④ 英原文に主語を加えた問題に修正して、再び英文翻訳を試みた。
 問題  人工知能(AI)を使った機械翻訳の進化が著しく、分野によっては大卒者並みの英語力を持っている。将来は機械翻訳はどの程度までできるようになるのか。人間は何のため、どの程度の英語力を身につければいいのか。

 ステップ ⑤ 英文翻訳結果
結果 The evolution of machine translation using artificial intelligence (AI) is remarkable, and depending on the field, it has English ability comparable to college graduates. To what extent will machine translation be possible in the future? For what purpose do humans have, how much English ability should they acquire?

 ステップ ⑥ 英文翻訳結果を再度問題として与え、日本語に戻してみた
結果  人工知能(AI)を用いた機械翻訳の進化は目覚しいものであり、分野によっては大学卒業者に匹敵する英語力があります。 将来、機械翻訳はどの程度可能でしょうか? 人間はどのような目的のために、どれくらいの英語能力を身に付けるべきですか?

  以上のテストの結果からも分かるように、細かいことを言わなければ実用段階に達しているように見受けられる。1つのテストから結論は出せないが、相当高度な翻訳をしていると私は思う。例えば 回答の一部の”・(AI) is remarkable , and depending・”の ",and" のような and の使い方は見事。and の前に”,”(コンマ)があるかないかで意味が変わる。コンマがなければ2つの文の単なる羅列だが、コンマを入れることにより「・・目覚ましいものであり、しかも大卒レベルの実力を・・」という意味合いを",and"に持たせた辺りの翻訳はとても優れた意味解析をしていると思った。

 Google 翻訳対応言語
アイスランド語, アイルランド語, アゼルバイジャン語, アフリカーンス語, アムハラ語, アラビア語, アルバニア語, アルメニア語, イタリア語, イディッシュ語, イボ語, インドネシア語, ウェールズ語, ウクライナ語, ウズベク語, ウルドゥ語, エストニア語, エスペラント語, オランダ語, カザフ語, カタルーニャ語, ガリシア語, カンナダ語, ギリシャ語, キルギス語, グジャラト語, クメール語, クルド語, クロアチア語, コーサ語, コルシカ語, サモア語, ジャワ語, ジョージア(グルジア)語, ショナ語, シンド語, シンハラ語, スウェーデン語, ズールー語, スコットランド ゲール語, スペイン語, スロバキア語, スロベニア語, スワヒリ語, スンダ語, セブアノ語, セルビア語, ソト語, ソマリ語, タイ語, タガログ語, タジク語, タミル語, チェコ語, チェワ語, テルグ語, デンマーク語, ドイツ語, トルコ語, ネパール語, ノルウェー語, ハイチ語, ハウサ語, パシュト語, バスク語, ハワイ語, ハンガリー語, パンジャブ語, ヒンディー語, フィンランド語, フランス語, フリジア語, ブルガリア語, ベトナム語, ヘブライ語, ベラルーシ語, ペルシャ語, ベンガル語, ポーランド語, ボスニア語, ポルトガル語, マオリ語, マケドニア語, マラーティー語, マラガシ語, マラヤーラム語, マルタ語, マレー語, ミャンマー語, モンゴル語, モン語, ヨルバ語, ラオ語, ラテン語, ラトビア語, リトアニア語, ルーマニア語, ルクセンブルク語, ロシア語, 英語, 韓国語, 中国語(簡体), 中国語(繁体), 日本語

 Google翻訳はなぜ急速に精度が向上したのか
   
GOTCHA! というサイトで「Google翻訳の精度はなぜ上がった?翻訳者は不要になる?専門家に聞いてみた」というページにその答えが見つかった。名古屋大学大学院情報科学研究科メディア科学専攻・特任教授、博士(工学)の中岩浩巳(なかいわ・ひろみ)氏が上記の問いに解りやすく答えてくれている。詳細はサイトを見ていただきたいが、要点を以下にまとめてみた。

 1970年代後半には「ルールベース翻訳」が一般的だったのに対し、90年代以降は「統計翻訳」が主流となってきた。
ルールベース翻訳では、文法や単語の意味などをひとつひとつ登録する。
 統計翻訳は大量の対訳データを解析し、その統計結果から適した訳し方を割り出す仕組み.。
 統計翻訳では対訳データの統計量がカギとなり、対訳データが多くなるほど精度が上がる。
Googleは、ディープニューラルネットという手法を積極的に活用した翻訳方式によって精度を一気に向上させた。
ディープニューラルネットは、機械学習のアルゴリズムの1つ。
それまでの統計翻訳では単語ごとの対訳データで翻訳をしてゆくイメージだったが、一方でディープニューラルネットを使った翻訳方式では、単語の意味だけでなく接頭辞や語幹、単語の位置なども考慮し、自然な文の流れを分析して翻訳できるようになった
大量のクラウドデータを持っているGoogleはデータ収集の点で有利だった。
Googleはデータ量もケタはずれで、データの扱い方も上手い。ディープニューラルネットは多層構造になっているので計算量が多く、時間がかかるのが難点だった。しかしGoogleは情報処理の速いコンピューターを導入するとともに、計算アルゴリズムを工夫することでその点を解消した。
Googleには優秀な人材が集まっているのも強み。
機械翻訳の世界は今は激変期。
 Googleは、Web全体の対訳統計データを網羅的に集めることが可能な体制なので、分野ごとに集めるというプロセスを経る必要がない強みを持つ。

  リアルタイムAI 翻訳(通訳)
 
  愛用のスマホ(ファーウエイhonor6 Plus、ver.6)を使って、実際に Google翻訳をテストしてみた。
 スマホのGoogle翻訳アプリを起動すると、直ちにリアルタイムの翻訳が可能となる。どの程度使えるのかをテストしてみた。その様子をビデオなどを使ってご報告する。なお、ネットワークは「フレッツ光ネクスト・ギガスマートタイプ」回線経由の自宅のWifi 環境である。

 日本語から英語へ、英語から日本語へと、両方向の翻訳をさせてみた。私の下手な英語でもまあまあ聞き取り、ちゃんとした日本語に翻訳してくれる。仕様上は「会話モード」というものがあり、起動中無操作で会話の言語を判別し、ちゃんと翻訳してくれることになってはいるが、言語を前もって選択しておいた方が、聞き取り精度が良く、スムーズな翻訳ができた。少し知っているスロバキア語も試してみたが、問題なかった。

 むろん、翻訳は2言語間でしかできず、例えば、同時に英語・日本語・仏語・中国語・・などの多数言語を同時通訳することはできない。

 海外旅行する場合はスマホは持参すると思うが、観光旅行程度であれば実に快適に使えると思った。


Google翻訳の実証テスト (写真はクリック拡大可能)
 
スマホ画面

Google翻訳のアプリ
アイコン
 
 
スマホにGoogle翻訳のアプリをPlayストアからインストールすると、メニュー画面に図のようなアイコン(赤丸囲い)が登録される。

Google翻訳のアプリ
立ち上がり画面


Google翻訳のアプリ
言語選択画面
  左の2つの赤丸で囲った2国語を、例えば、英語と日本語というように選定する。現時点で、対話モードは32 言語に対応できる。

Google翻訳
(英語⇔日本語)
 下記の例文を用いて日・英語間のGoogle翻訳・実証テストを行った。結果は YouTube 動画で確認してい頂きたいが、日本語はともかく、私の下手な英語でもちゃんと聞いてくれたのには感心した。

   (例文)
 私は岡松と申します。 お会い出来て大変嬉しいです。
 私は千葉市に住んでいます。
 
私は77歳です。
 どちらの国から来られましたか?。
 何かお手伝いしましょうか?

 I am very glad to meet you.
 
My home is in Chiba-city.
 
Which country did you come from?
 
Do you need my help?


  実用的には充分な性能を持っている。海外出張の際にはぜひ携行すべきである。ビジネスの面では使えないことはないと思うが、これに頼るのは危険だろう。誤訳や意味取り違えなどはあり得ると考えるべきだ。

 Google翻訳アプリを日本語と英語間の両国語間ででテストしてみたわけだが、日本語から英語への翻訳はとてもスムーズで、誤訳もなし。逆はやや不調。私の下手な英語の発音のせいかも。

 仕様では、「国語を指定しなくても自動的に国語を判定する」となってるが、私の場合はスマホのせいか読み取りがまともにできなかった。したがって、今回のテストでは話すたびに言語名をタップした。2人の間にスマホを置くだけで異国語間の通訳ができるわけで、早く実用になることを希望する。


 Word Lensを利用したリアルタイム翻訳
 

 Word Lens を使って、例えば、英語の看板にスマホのカメラをを向けると、画面の文字が日本語に翻訳された文字に置き換わるという画期的なソフト(下の写真)。

 言われてみるとこれも立派なリアルタイムの翻訳だと感心。良く考えたものです。説明文を読むより、下の写真をクリックして拡大すると一目瞭然!


  (注:この部分は当ホームページ AIスピーカーを展望する から引用)



空港にて(実写) 

 これを最初に知った時、さすがグーグル・・と感動。昔、仕事でスロバキアの首都ブラチスラバで半年間生活したことがある。レストランの食事にも飽き、では自炊するか・と考え、スーパーに買い物に行ってはみたが野菜はともかく、日用品にしろ缶詰にしろ、何が入っているのか不明、何せ生活がかかっているのである、ほとほと参った。日用品では油なのか洗剤なのか分からないのである。缶詰などは絵や写真がついたものを買うしかない。ああ・これは鮭だな、これはイワシの缶詰か・・と言った具合。 そういうときに「リアルタイム翻訳」があると助かったのに・・と思った次第。 


  リンク集
 
夢のリアルタイム音声翻訳    ニューラルネットワークの技術を持たない翻訳システムは撤退することになるでしょう。
Googleの音声認識 ワードエラー率が1年経たずに「8.5%」から「4.9%」まで改善! もはや人間レベル? 
Google翻訳アプリの使い方  海外旅行に必携、音声入力から画像、手書き、リアルタイムのカメラ翻訳まで
10分でわかる情報科学:グーグル翻訳 Google翻訳は100以上もの言語のあいだで自由に文章や音声を翻訳できるサービスです。このビデオでは、その裏側を支える「ニューラル翻訳」という技術のエッセンスをお伝えします。

  まとめ
 
 冒頭で、① 機械翻訳の状況、② 機能、③ 実用性、④ 機械翻訳が急速に発展した理由、という設問を掲げて議論を進めてきたが、ほぼクリアできたようである。機械翻訳のリーダー格がGoogle翻訳であることも明らかになった。

 機械翻訳は、2016年秋を機して飛躍的な進歩を遂げ、ほぼ実用段階になったといえる。海外の観光旅行の際には、Google翻訳をインストールしたスマホをぜひ携行すべきである。
 Google翻訳では、音声・テキスト入力・手書き文字・カメラからの入力といった多様な入力が可能で、特に、音声による翻訳の性能の良さは驚くばかりだ。

 機械翻訳会社経営の栄藤氏は機械翻訳の性能レベルについて次のように述べている。(2017年9月17日 読売新聞記事「AI翻訳進化 英語教育必要?」より引用)

 昨年秋、米グーグルがAI翻訳を実用化すると、翻訳を取り巻く風景がガラッと変わってしまった。これまで5段階評価で3.5だった翻訳精度が、いきなり4.5になった。5は人間と変わらない。4はちょっとおかしいが意味は通じる。3はまあまあ通じるという具合。不可能と思われていた翻訳精度が一気に達成された。


 これを可能にした理由は、技術的な基盤として、統計翻訳という技法と、機械学習のアルゴリズムであるディープニューラルネットという手法を導入したことにある。Googleがクラウドデータベースに蓄積した気が遠くなるような莫大な量の統計データと、超高速のコンピュータ処理を導入したこともポイントの1つである。Googleのこの優位性は、先になればなるほど大きくなり、圧倒的な地位を占めるであろう。
 AIスピーカーのGoogleホームも同じような基盤を用いているので、米国で圧倒的な人気を独占しているアマゾンEcho型をいずれ抜き去るでろう。しかも、可搬型であるスマホを用いたものになるに違いないと筆者は読んでいる。アップルについても同様に先細りとなるだろう。

                     (以上)