ここから本文です

スマホで議事録を自動作成、誰が何を話したかまで特定

ニュースイッチ 10/8(土) 14:01配信

情報学研と筑波大が音声処理技術。音楽やセキュリティーでの活用も

 国立情報学研究所の小野順貴准教授と筑波大学の牧野昭二教授らは、複数のスマートフォンをマイクロホンアレイとして使う音声処理技術を開発した。会議をスマホで収録するだけで誰が何を話したか特定でき、議事録を自動作成できるようになる。3年程度での実用化を目指す。

 会議など複数の声が混じったデータから話し手を特定するには、マイクロホンアレイで収録する必要があった。話し手からマイクに音が到達するまでの0・1ミリ秒以下の時間差から、音源の方向を推定するために複数のマイクを厳密に同期する。同期できないと話し手が移動しているように判定されてしまう。

 そこで収録音声データで話し手が動かないように調整する信号処理技術を開発した。複数のスマホをマイクロホンアレイとして使える。会議の議事録作成や音楽の収録編集システムなどに提案する。

<解説>
 スマホやパソコンを持ち寄って会話を記録すると、議事録ができ上がるシステムを目指している。現在は話し手があまり動かない会議をターゲットにしているが、コンサートやスタジアムなどの大規模イベントの同時多点収録も開発ターゲットに挙がっている。

 観戦だけでなく、セキュリティーなどにも応用が広がりそう。もっと早く実用化しそうなのがスタジオ収録。プロはちゃんとしたスタジオでバンドの楽器ごとに収録し、編集して合成する。しかしアマチュアにはそんなお金はない。スマホで収録、音源を分離して楽器ごとに編集、合成できると、一発で合わせなくても良くなる。

最終更新:10/8(土) 14:01

ニュースイッチ

TEDカンファレンスのプレゼンテーション動画

「水中に潜む本当の危機」
インドガリアルとキングコブラはインドの象徴ともいえる爬虫類ですが、水質汚汚濁のために存亡が危ぶまれています。環境保護者のロミュラスウィトカーがこの素晴らしい動物たちの貴重な映像をお見せして、彼らのそして私達の生活を支えている川の保全を訴えます。