ここから本文です

音声入力が広まらない理由は「恥ずかしさ」? キーボードが滅びる未来はくるか

ITmedia Mobile 7月9日(土)11時25分配信

 音声による端末とのやりとり、いわゆる「音声入力」が近年注目を集めている。GoogleやApple、Amazonといったテクノロジー業界をけん引する大企業が次々と新製品を発表し、「パーソナルアシスタント」や「スマートホーム」などさまざまな分野で普及が期待されているからだ。

【画像】iPhoneの音声入力をオフにする方法

 米国で発表された未来のネット予測レポート「INTERNET TRENDS 2016」によれば、2020年には音声によるWeb検索が50%を占めるようになるという。「これからはあらゆる分野で音声入力が一般的になり、キーボードのような前時代的な入力デバイスは廃れていく」。中にはそんな風に考えている人もいるようだ。

 しかし、本当にそうだろうか? 音声入力が広く普及するために越えなければならない大きな壁――“恥ずかしさ”の問題について考えてみたい。

●「音声入力使わない理由ってなんですか?」

 2016年4月、Twitter上でこんなトピックが盛り上がった。

 平成10年生まれ「何で平成一桁生まれの人たちって、がんばってフリック入力でTwitterしてるんですか? 音声入力使わない理由ってなんですか?」

 このツイートに対し、多くの意見が寄せられた。「音声入力なんて生まれてこのかた一度も使ったことない」「誤変換が嫌だから」「フリック入力の方が早い」。そうした中で目立ったのが、「人前でスマホに向かってしゃべるのは恥ずかしい」という意見だ。

 人前(公共の場)で音声入力を使うのは恥ずかしい。あるいは、周囲に対して失礼だ/適切でない。そんな考え方は、現代の日本でまだまだ根強いように思われる。元ツイートをしたけんすうさんも、「電車の中で音声入力ができる一番いい方法ってなんでしょうね」と、“パブリックな空間での音声入力”について触れている。

●音声入力は恥ずかしい?

 同様の意見は他にも見られる。2016年4月発売の書籍『理系に学ぶ。』の中で著者の川村元気さんは、ヒト型ロボット電話「ロボホン」の開発者である高橋智隆さんと対談し、こう語っている。

(以下引用)
高橋 スマホの限界として、せっかく音声認識機能を入れたのに、思ったようにみんなに使ってもらえていないという状況があって、そこはロボットにチャンスがあると思ってます。

川村 単純に恥ずかしいんですよね。スマホに話しかけてる自分が(笑)。

高橋 相手が黒い四角の箱だからイヤなんだと思います。その点、ヒト型なら話しかけやすいかもしれないし、持ち主の趣味嗜好だけを知るロボットとの会話から多くの情報を得られる。スマホの次は確実に小型のヒューマノイドロボットの時代が来ます。

川村 僕らがそれを買うことができるのはいつくらいになりますか?

高橋 たぶん5年後くらいまでにはスマホと2台持ちが当たり前になって、10年後はスマホとロボットが一体になっていると思いますよ。
(引用ここまで)

 そう、音声入力はやはり「恥ずかしい」。iPhoneに「Hey, Siri!」と話し掛けるのも、Androidに「OK Google」と呼び掛けるのも、MicrosoftのCortanaもAmazonのAlexaも、みんなどこか、気恥ずかしい。

●「恥ずかしくない音声入力」もある

 しかし一方で、こうした音声入力を自然に使いこなしている人たちもいる。冒頭で紹介したような若者に限った話ではない。ITmediaの寄稿者でもあるライターのSさんは、毎日のようにPCやスマートフォンで音声検索を使い、「OK Googleで、できるようになってほしいこと」(内容はかわいらしい話だが)というコラムも書いている。

 こうした事例について考える中で、一口に音声入力といっても、実は「いくつかの分類」ができることに気が付いた。いわば、恥ずかしさがなく「広まりやすい/受け入れられやすい音声入力」と、そうでない音声入力があることに気付いたのだ。

 「恥ずかしくない音声入力」とはどんなものか。まず考えられるのは、Sさんが毎日のように使っているという音声検索のように「単語や単文」で、かつ「指示や命令」の形式を取っているもの。例えば「渋谷 映画」や「部屋の電気のスイッチを点けて」のように、単機能の命令の場合だ。

 こうした内容であれば比較的恥ずかしさを感じにくいというのは、理屈でなく感覚的にも理解がしやすいだろう。さらに後述するが、これらには「空間的な恥ずかしさ」が伴いにくいというメリットもある。

 一方で、「メールやSNSに投稿する文章を文字入力する」といったタスクは、音声で(しかも人前で!)こなすには心理的なハードルが相当に高い。記事冒頭で紹介した「Twitterを音声入力する」ことに抵抗を感じる人が多いのが良い例だろう。「(笑いを表す)『www』を『わらわらわら』って口に出して言うの?」という疑問からは、「自分の考えや感情を、機械に向かって口に出すなんて」という心理的抵抗が見て取れる。

●空間がもたらす恥ずかしさ

 音声入力にまつわる恥ずかしさを考える上で、さらに重要な観点がある。空間(場所)の問題だ。

 先ほど「恥ずかしくない例」として挙げた「部屋の電気のスイッチを点けて」という命令は、当然ながら室内でしか、それもほとんどの場合は自宅でしか発されない言葉だろう。Google HomeやAmazon Echoといった、いわゆる「スマートホーム」を構成するためのプロダクトは、この点で“恥ずかしさ”への問題をほぼクリアしている。それはそうだろう、誰も見ていない自宅で「電気を点けて」といったところで、誰が気にするというのだろう。

 反対に、メールなどの文章入力や音声検索は、どんな場所でもする行為だ。周囲に人がいなかったり、外を歩きながらハンズフリーで使ったりする分には問題ないかもしれないが、電車の中のようなパブリックな空間で使うことはまず不可能。先ほどは「比較的恥ずかしくない」と書いた単語レベルでの音声検索ですら、電車の中では難しい。試しに電車内で「六本木 居酒屋 個室」や「鶏肉 カレー レシピ」などと発声できるか試してみてほしい。筆者なら想像しただけで恥ずかしくなってしまう。

 このように、音声入力には向いている状況とそうでない状況がある。まとめると、電車の中のようなパブリックな空間で、単語レベルではなくメールのような文章を書くケースは、現在のボタン/キーボード入力が音声入力に簡単に取って替わられるとは思えない。

 それとは対照的に、自宅などのクローズドな空間で、単機能の命令で済むようなタスクは、今後間違いなく音声入力がメインになっていくだろう。「テレビのリモコン」や「エアコンのスイッチ」といった言葉が過去の物になる日も、そう遠くはないのかもしれない。

●「デバイスで一発逆転」なるか

 ただし、こうした「恥ずかしさ」のような時代性を反映しやすい感情が、新たなデバイスの登場によって一気に解決されてしまう可能性もある。

 例として、以前であれば外を歩きながら独り言をブツブツつぶやいていたら訝しまれたものだが、今はその人の耳に「白いイヤフォン」を見つけた時点で誰も気にしなくなる。スマートフォンでハンズフリー会話をしているとすぐに分かるからだ。そうした光景に皆が「慣れた」のだ。

 現在問題となっている「歩きスマホ」について、こんな光景(=人々が画面に持った小さな機械を一心に見つめながら街を歩く風景)が当然になる未来を、過去に想像できた人はいただろうか。同じように、街中の人が一人で、四六時中端末に向かってブツブツつぶやいているような未来がやってくるのか――そんな風景が少し楽しみでもあり、大いに恐ろしくもある。

最終更新:7月9日(土)11時25分

ITmedia Mobile

TEDカンファレンスのプレゼンテーション動画

暗闇で光るサメと驚くほど美しい海洋生物たち
波のほんの数メートル下で、海洋生物学者であり、ナショナルジオグラフィックのエクスプローラーかつ写真家のデビッド・グルーバーは、素晴らしいものを発見しました。海の薄暗い青い光の中で様々な色の蛍光を発する驚くべき新しい海洋生物たちです。彼と一緒に生体蛍光のサメ、タツノオトシゴ、ウミガメ、その他の海洋生物を探し求める旅に出て、この光る生物たちがどのように私たちの脳への新たな理解を明らかにしたのかを探りましょう。[new]