~高精度化した英日AI自動翻訳のエコシステムを創出~
国立研究開発法人情報通信研究機構(理事長:徳田 英幸、以下「NICT」)は、Linuxを含むオープンソースソフトウェアを推進するLinux Foundation Japan(日本代表者:福安 徳晃、以下「LF」 )に、「みんなの自動翻訳」のAI自動翻訳技術を提供します。LFは、AI自動翻訳技術をLFのサーバに実装し、2021年1~3月期のサービス開始を目指します。LFのオープンソースプロジェクトで同自動翻訳エンジンを使用し、翻訳作業で生成されるオープンソース技術関連の対訳・語彙データをNICTの翻訳バンク(注1)にフィードバックします。
両者が協力することで、オープンソースソフトウェア向けの高精度AI自動翻訳システム(注2)を育てていくエコシステムを創出し、日本のソフトウェア開発を支援してまいります。
【背景】
ITに関わるソフトウェアの進化は急速で、その要であるオープンソースソフトウェア支援団体の代表がLinuxの作者Linus Torvaldsを擁するLFです。LFは、オープンソースソフトウェアに関する英語文書を大量に出版しており、クラウド等の最新のソフトウェア情報をいち早く日本語化することは、日本の競争力を高める鍵となっています。
しかし、英語と日本語は文法も語彙も異なるため、言葉の壁から、日本のエンジニアやマネージメント層が最新技術をキャッチアップするのに苦労するような場合も生じています。
【今回の協力について】
今回、NICTは、言葉の壁を越え、いち早く最新情報を入手できるようにするため、LFにNICTの自動翻訳エンジン「みんなの自動翻訳」を提供します。
NICTの自動翻訳エンジンをLFのサーバで稼働し、オープンソースソフトウェアコミュニティの翻訳協力者はLFのシステムにログインして自動翻訳エンジンにアクセスします。翻訳作業を効率化するとともに生成される対訳データを翻訳バンクにフィードバックします。これを追加的に学習して高精度化したエンジンで、再度LFのサーバを更新します。このようにして、オープンソースソフトウェア向けの高精度AI自動翻訳システムを育てるエコシステムを創出します。
LF代表は「海外の企業とのビジネスが一般的になった現在でも、言語の壁は引き続き日本の産業の大きな課題であると感じています。特に情報の多くが英語で生成されるオープンソース技術は、ドキュメントを含めた様々な情報が日本語化されない限り、最先端の情報が国内で一般化されないという重要な課題に直面しています。今回のNICT様との取り組みを通じて、最先端の技術情報がより早くかつ大量に日本語化され、日本のオープンソース開発者が迅速に必要な技術情報にアクセスできる環境づくりに寄与することを願っています。」と述べています。
【今後】
NICTのAI自動翻訳技術をLFのサーバに実装後、LFは2021年1~3月期のサービス開始を予定しています。両者は協力して、エコシステムを強化し、オープンソースソフトウェアに関する日本の言葉の壁を解消して、日本のソフトウェア開発を支援してまいります。
サービス開始時はLFのオープンソースプロジェクトで使用し、プロジェクト横断的に業界に特化した対訳・語彙データを生成することで、日本のオープンソースコミュニティ全体が安心して利用できる翻訳精度の高い自動翻訳システムを構築することを目指します。
(注1)翻訳バンクについて
自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データ(対訳データ)の質と量の影響も大きく、高品質翻訳データの大量の確保が重要となります。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいます。
https://h-bank.nict.go.jp/
(注2)AI自動翻訳システムについて
NICTでは、AI技術で多用される深い階層構造を持つネットワークを用いた自動翻訳技術(AI自動翻訳)の研究開発を推進し、研究成果である高精度自動翻訳システムをTexTraと名付けて公開しています。
公開サイト「みんなの自動翻訳@TexTra®」(https://mt-auto-minhon-mlt.ucri.jgn-x.jp/)では、WordやPowerPointのファイルを直接翻訳するなど、様々な方法で翻訳精度を試すことができます。
Linux Foundationについて
Linux Foundationは、オープンソースソフトウェア、オープンスタンダード、オープンデータ、およびオープンハードウェア分野の技術協力をグローバルに推進しています。Linux Foundationの目的は、オープンソースプロジェクトに関わる持続的なエコシステムを構築し、技術の発展や商業的な活用を促進することです。https://www.linuxfoundation.jp/
国立研究開発法人情報通信研究機構(NICT)について
NICTは情報通信分野を専門とする我が国唯一の公的研究機関として、豊かで安心安全な社会の実現や我が国の経済成長の原動力である情報通信技術(ICT)の研究開発について基礎から応用までを推進するとともに、産学官連携や事業振興などに総合的に取り組んでいます。https://www.nict.go.jp/
本件に関するお問い合わせ先
Linux Foundation
【広報】
広報担当:大竹
E-mail: notake@linuxfoundation.org
国立研究開発法人情報通信研究機構(NICT)
【広報】
広報部 報道室:
廣田 幸子
Tel: 042-327-6923
E-mail: publicity@nict.go.jp
【翻訳に関すること】
先進的音声翻訳研究開発推進センター:
隅田 英一郎
Tel: 0774-98-6350
E-mail: textra-info@khn.nict.go.jp
The Linux Foundation はさまざまな商標を登録および使用しています。The Linux Foundation の商標一覧はこちらのページでご確認いただけます。
Linux は Linus Torvalds の登録商標です。