ここから本文です

富士通研究所、会話音声から満足や不満を自動的に特定する技術を開発

EE Times Japan 10/18(火) 13:33配信

■人の判断と比較して約70%の精度

 富士通研究所は2016年10月17日、コールセンターや銀行窓口などで、顧客と応対者の会話音声から自動的に満足や不安を特定する音声分析技術を開発したと発表した。

【同技術による明るさの定量化のイメージ】

 同技術により、満足や不満を人が聞いて判断した結果と比較して、約70%の精度で推定可能。富士通とエフサスのコールセンター3拠点において、同技術の評価ツールを用いて実施した実証実験では、教育にかかる時間が30%減と効率化を実現できたという。

 同技術は、2016年度末から富士通とエフサスでコールセンター関連サービスで商品化予定。また、富士通のAI技術「Human Centric AI Zinrai」を強化する技術としても利用し、銀行窓口や医療、教育現場などにおいて、2018年度の製品化を目指す。

■声の高さの変化パターンから

 コールセンターや遠隔教育サービスなどでは従来、音声認識技術を用いて顧客との会話音声を文字に変換して、顧客の感情を把握する取り組みが行われてきた。

 しかし、実際の会話は文法と関係なく話されるほか、周囲の雑音の影響もあるため、誤って変換される場合があるなど、技術的に困難な部分が多い。文字に起こして分析する手法そのものも、顧客の感情を正確に捉えることが難しかったという。

 富士通研究所が開発した技術は、声の高さの変化から「声の明るさ」を定量化する。一般的に、明るい声は声のトーンが高く、声のトーンや声量が大きく変化する性質がある。明るい声には、話し始めや話し終わりの声の高さの変化に特有の性質があることも分かったという。そのため、声の高さの平均や変化の分析と、音声データ中の相対的な位置における特有の変化を捉える手法を組み合わせて、声の明るさの定量化に成功した。

 また、富士通研究所は、声の印象として知覚される「明るさ」と「満足感」には高い相関関係があるため、独自の調査結果に基づく変換式により会話中の満足感も定量化。これと現場の応対評価の結果と合わせて、機械学習を用いて満足や不満の判定閾値(しきいち)を学習することで、自動的に満足・不満箇所を特定する技術も開発した。

最終更新:10/18(火) 13:33

EE Times Japan