2017年5月号 <企業アプリ最前線>

企業アプリ

企業アプリ

企業アプリ

トップ画面のイメージ(上)。マイクボタンを押して言葉を発すると、発話した元の言葉、翻訳された言葉、そして再度元の言語に翻訳し直した言葉が表示される(中)。発話できないシーンではテキスト入力もできる(下)

VoiceTra(ボイストラ)

情報通信研究機構(NICT)

アプリアイコン

総務省所管の国立研究開発法人。情報通信分野を専門とする唯一の公的研究機関として、産学官で連携した情報通信技術(ICT)の研究開発、同事業の振興業務などを行う。

 「2020年に4000万人の訪日外国人」という観光客数の目標値を示した政府。インバウンドの旅行客も増え、国内の観光・流通産業は賑わうとともに対応に追われている。

 こうしたなか、活用が進みつつあるのが情報通信研究機構(NICT)のスマートフォン向け多言語音声翻訳アプリ「VoiceTra」だ。

 画面上のマイクボタンを押して言葉を発話すると、指定言語に翻訳した結果がテキストで表示され、音声を流すこともできる。さらに、その翻訳結果が正しいかどうかを確認できるよう、再度元の言語に翻訳し直す機能も提供している。

 例えば、日本語から英語に変換する指定をした場合、「駅までの行き方を教えてください」と発話すると認識した日本語(元の言語)と、翻訳された「Please tell me the way to the station.」が表示され、その英語を日本語に再度翻訳した「駅へ行く道を教えてください。」という3つの文章が表示される。同機構では、これらの誤りをアンケートで収集することで、音声翻訳の精度を高めている。

 対応しているのは、翻訳が31言語、音声入力は20言語、音声出力は16言語。先進的音声翻訳研究開発推進センター 企画室 室長の内元清貴博士は「2015年に定めた中長期計画のミッションの一つが、2020年のオリンピック対応でした。これを実現すべく、このアプリは主に、観光での使用を想定しており、買い物や交通、医療機関、ホテルなどでの利用シーンで使われる言葉に対応しようとしています」と話す。

 注目すべきはその音声認識精度だ。国際会議IWSLTが開催した英語の講演音声を対象とする音声認識能力コンペで、3年連続1位となったという。「とくに、深層学習の導入や、拍手や笑い声などの抑圧技術などの仕組みが高精度につながりました」(内元氏)

 この音声翻訳技術を活用して サービス・製品化している民間企業は多く、現在進められている実証実験ではタクシーや銀行窓口、交番などでも活用されている。