ここから本文です

情通機構、元素記号にも対応した英文特許の自動翻訳 クラウドサービス開始

5/15(月) 15:10配信

日刊工業新聞電子版

3億5000万文の対訳ビッグデータ

 情報通信研究機構は、みらい翻訳(東京都渋谷区)などと共同で、安全かつ精度の高い英文特許の自動翻訳技術を開発した。高度な特許翻訳エンジンを開発し、これまで難しかった特許文献固有の表現を正確に訳せるようにした。4月から、企業などが持つ特許情報をクラウド上で安全に自動翻訳するサービスを開始。同様のサービスは珍しく、米国特許公報や欧州特許公報、国際出願公報を日本語で正しく理解できるとして、企業のニーズをつかみそうだ。

 近年、世界中で特許侵害や訴訟のリスクが増えており、企業が外国の特許文献をつぶさに把握する必要性は年々高まっている。こうした背景から、特許文献の翻訳ニーズは増大しているが、一方で、特許文献に頻繁に現れる専門用語を人が介入せずに自動で翻訳することは難しい。

 従来は、特に「元素記号などの翻訳がうまくいかなかった」とみらい翻訳セールス&マーケティング部の藤原祥造マネージャーは漏らす。また、ウェブ翻訳などの無料のオンラインサービスは手軽だが、特許に特化したものはほぼなく、翻訳精度に問題があるほか、情報漏えいのリスクも避けられなかった。

中日・韓日翻訳も

 そこで情通機構とみらい翻訳は、日本特許翻訳(東京都中央区)、化学情報協会(東京都文京区)とともに、こうした課題を解決する自動翻訳技術の開発に取り組んだ。まず、情通機構と日本特許が、英語で出願された特許のパテントファミリー(優先権を主張して複数の国に出願した特許の出願群)から、従来比10倍超となる3億5000万文の英日特許の対訳ビッグデータを構築した。

 加えて、「翻訳しやすいように単語を並べ替えるためのアルゴリズムを改良した」(内山将夫・情通機構先進的音声翻訳研究開発推進センターマネージャー)。さらに、日本特許と化学情報協会が、医薬・化学分野の文献に頻出する化合物表記を厳密に翻訳できる機能を盛り込んだ。

 これにより、市販の特許翻訳ソフトよりも優れ、ウェブ翻訳と比べると20%精度の高い翻訳エンジンが完成した。翻訳エンジン開発と特許翻訳、化学の各専門家が知恵を出し合うことで、「図表や数式を含む特許公報において、正確で読みやすい、表記通りの日本語訳を提供できるようになった」と藤原マネージャーは胸を張る。

 サービス開始後、製造業からの問い合わせが増えたという。同サービスは会員から特許公報番号をもらい、翻訳結果のダウンロードリンクをメールで提供する仕組み。情報の授受は会員限定のサイト上など閉じた中で行うため、安全性は確保されているようだ。

 英日翻訳だけでなく、中国語の特許文献を訳す中日翻訳も可能。情通機構は韓国語の翻訳エンジンの開発も手がけるため、みらい翻訳などは今後、韓日翻訳サービスも検討する。情通機構は多言語特許文献の翻訳に関して特許庁とも協力しており、翻訳エンジンの性能向上にも期待がかかる。