ここから本文です

国際会議や取材で大活躍の文字起こしツール、Otterの機能と注意点は?

10/8(火) 7:10配信

ITmedia エンタープライズ

 先週、McAfeeの取材協力により、ラスベガスで開催されたイベント「MPOWER」に参加してきました。海外のイベントということで当たり前ですが全編英語、当然同時通訳などもなく、とにかくヒアリングに集中し、途切れることのない英語の洪水を浴び続けるというお仕事です。

Otterが便利すぎる!

 私の英語力は、多くの日本人同様「聞けるけれど、しゃべれない」レベル。2時間30分の基調講演をレポートするには、とにかく集中力が勝負の鍵でした。が、今回は大丈夫。強い味方「Otter」があります。

文脈まで読み取って単語をテキスト化する「Otter」が便利すぎる!

 Otterは、英語の音声をテキスト化するサービスです。講演や会議などをOtterのスマートフォンアプリで録音すると、クラウド上でリアルタイムにテキスト化してくれます。英語が苦手な日本人にとって、大変ありがたいサービスです。

 もしかするとこれだけでは、単なる(?)音声認識サービスのように思われるかもしれません。しかし、一度このアプリを入れて、例えばTEDのような英語講演をPCで再生し、それをアプリで聞き取らせてみれば、すぐにその便利さが分かると思います。

 非常に面白いのは、一度認識された単語が後からグリグリと修正されていくこと。おそらく文脈を読み取るアルゴリズムが働いているのだと思われます。さすがに100%とはいかないものの、かなりの精度でテキスト化できることが分かるでしょう。

 一度テキストになってしまえば、後は全文をGoogle翻訳にかけるもよし、分からない単語を個別に辞書で調べるもよし。このサービスがあったおかげで、今回の取材は非常に楽に、というか「集中力が途切れても、テキストのバックアップがあるからなんとかなる」という状況になりました。

非ネイティブには嬉しい数字表現の認識

 テキストの中では「McAfee」や「Rami Malek」などの固有名詞もしっかり認識されています。残念ながら「SaaS」や「CASB」といった短縮用語は「SAS」「Casspi」などになってしまっていましたが、一方で「Nine billion one hundred and ninety-two million six hundred and thirty-one thousand seven hundred and seventy」を「9192631770」(1秒間を定義するセシウムの共鳴周波数)と認識してくれるのは非常にありがたかったです。

 テキストをクリックすると録音された音声の該当箇所を再生できるため、後から音声を追うインデックスとして使用するのにも便利です。米国ではイベントの運営側がこのOtterでパブリックなグループを提供しているようで、複数セッションの講演テキストが誰でも見られるようになっていて、驚きました。

 もし、英語でのテレカンに参加する機会や、英語の講演を理解する必要がある場合、Otterの使用をお勧めします。無料でも月間600分の枠が用意されているので、ほとんどの方は無料で十分使えるのではないでしょうか。

1/2ページ

最終更新:10/8(火) 7:10
ITmedia エンタープライズ

こんな記事も読まれています

あなたにおすすめの記事