ここから本文です

人の声が持つ可能性とは?東芝の技術を使ったアプリ「コエステーション」がおもしろい

10/8(火) 20:01配信

ライフハッカー[日本版]

インターネットラジオやオーディオブックなど、聞くだけで情報収集や勉強ができる「音声メディア」が注目されています。

【全画像をみる】人の声が持つ可能性とは?東芝の技術を使ったアプリ「コエステーション」がおもしろい

さらに、情報を受け取るだけでなく、個人でも音声で発信ができる「Voicy(ボイシー)」など“声のブログ”と呼ばれるようなサービスも、活発な動きを見せています。そこで、今回は「音声メディア」に欠かせない存在である「人の声」の可能性について考えてみました。

「音声メディア」が活発化する中で、これから「声」はどのような役割を果たすのでしょうか?

音声が持つ可能性、東芝の技術を使ったアプリ「コエステーション」とは

お話を伺うのは、東芝デジタルソリューションズ株式会社の金子祐紀さん。自分の声を音声合成できるプラットフォーム「コエステーション」の事業推進プロジェクトリーダーです。

音声合成や音声認識などの技術を持っていた東芝が、2016年から開発をはじめ、2018年に有名人や一般人の声を集めて活用するために立ち上げた「コエステーション」。個人ユーザーがアプリとして利用できるほか、声優やタレントなどプロの声を活用するための事業も展開しています。

「コエステーション」とは、人間の声を人工的につくれる音声合成技術をつかった新しいプラットホーム。スマートフォンアプリを個人で利用する場合、まず指定のいくつかの文章を読み上げていきます。すると、自動で声の特徴をAIが学習し、自分の声の分身「コエ」を作ってくれるのです。

ちなみに上手に自分の声を登録するコツは、静かな場所で、一定の調子で指定の文章を読むこと。登録を進めていくと、声を出して文章を読む難しさに改めて気がつきます。

「コエ」を作った後は、テキストを入力するだけで「コエ」に合成音声で喋らせることができます。そうやってデジタル化された声は、今後さまざまなコミュニケーションやサービスに利用できる可能性があるそう。

テレビ会議や数年後には外国語習得にも?ビジネスパーソンの「声」活用法

自分の声をデジタル化して保存する「コエステーション」を、ビジネスパーソンはどのように活用できるのでしょうか。

例えば、スカイプなどを使ってテレビ会議に参加する場合。これまで、声を出して喋ることのできない新幹線などの移動中には、テキストチャットで参加するのが普通でした。でも、この方法ではすぐテキストに気がついてもらえない場合もあり、会議室とのタイムラグが生じてしまいます。

そんなときでも、「コエステーション」で「コエ」を作っておけば、テキストを打ちこむだけで「あなたの声」で会議に参加できます。

自分そっくりの音声で参加できるので、会議室のメンバーとの微妙な温度差がなくなるだけでなく、スムーズに意見交換をすることができるんです。ほか、在宅勤務で子どもが近くにいるなど「音声で会議に入るのが難しい状況」を解消してくれます。

最初は、テレビ会議の用途では、病気など何らかの要因で“自分の声が出ない人”しか使わないだろうと考えていたなかで、こういった利用方法の提案を受けたのは意外でなるほどと思いました(金子さん)

また東芝の音声合成技術は、すでに11言語に対応。現在、声の合成は“日本語から日本語”のように同じ言語間に限られていますが、将来的には“日本語から英語”などへの合成ができる「クロスリンガル」という機能を予定しています。

これが実現すると、ハリウッドスター自身の音声で日本語吹き替えができるなどの可能性が。この機能をビジネスパーソンが活用するなら、テキストで打ち込んだ日本語を自分の声で英語読み上げさせて、英語学習や英語でのプレゼン準備などに使えそうです。

1/3ページ

最終更新:10/8(火) 20:01
ライフハッカー[日本版]

こんな記事も読まれています

あなたにおすすめの記事