ここから本文です

オンデヴァイスのAIは、音声認識のゲームチェンジャーになるか

5/22(水) 19:11配信

WIRED.jp

人工知能(AI)による音声アシスタントに、毎日のように話しかけている人は多いだろう。でも結果はいつも思い通りというわけにはいかず、イライラさせられることもあるはずだ。

グーグルが「Google I/O」で発表した7つの重要なこと

こうしたなか、グーグルが音声認識の精度を著しく向上させる新技術を明らかにした。音声認識ソフトウェアのサイズを25分の1に圧縮できたことで、音声操作などが飛躍的に便利になるという。

おかげで、これまでクラウドのサーヴァー側で動かしていたプログラムを、スマートフォンにインストールできるようになる。つまり、処理速度が格段に速くなるわけだ。これを最高経営責任者(CEO)のスンダー・ピチャイは「大きなできごと」だと説明した。

多くの処理がデヴァイス側で完結

開発者カンファレンス「Google I/O」の基調講演で披露されたデモでは、話した瞬間にデヴァイスがその内容を理解していく様子が示された。音声データをクラウドに送信する必要がないため反応が非常に速く、これなら確かにスマートフォンの操作方法が根本から変わる可能性もあるかもしれないと思わせる。

実際、グーグルのAIアシスタントは、アップルの「Siri」のような競争相手よりはるかに優れた能力を発揮した。シニアプログラムマネジャーのメギー・ホリンガーが、音声コマンドで何ができるかをひとつひとつ紹介していく。すべてのタスクで、競合他社の音声アシスタントより処理が速かった。しかも、毎回「OK、Google」というウェイクワードを言う必要がないという。

ホリンガーは、2回のタップと3つの短いフレーズだけで旅行の写真を友達に送ることに成功した。彼女が「イエローストーン(国立公園)の写真を見せて。動物の写っているやつ。ジャスティンに送って」と言うと、数秒もしないうちに「Google Photo」でバイソンを撮った写真が表示される。タップとスワイプだけでこの写真を探し出すのは、かなり骨が折れるだろう。

グーグルのAI部門を率いるジェフ・ディーンは、音声認識をデヴァイス側で完全に処理できるようになったことで「スマートフォンの使い方が変わる」とツイートしている。これまではサーヴァーでの処理とデヴァイスでの処理が併用されていたが、今後は多くの場合でデヴァイアス上ですべてが完結するようになる。

1/3ページ

最終更新:5/22(水) 19:11
WIRED.jp

記事提供社からのご案内(外部サイト)

『WIRED Vol.33』

コンデナスト・ジャパン

2019年6月13日発売

1,200円(税込み)

『WIRED』日本版VOL.33「MIRROR WORLD - #デジタルツインへようこそ」来るべき第三のグローバルプラットフォームを総力特集

こんな記事も読まれています

あなたにおすすめの記事