ここから本文です

日本トップクラスのAI研究者が語る、人工知能の歴史と産業との関係

@IT 7月14日(木)6時10分配信

 金融庁は欧米に通用するFinTechベンチャー企業の育成を目指して「フィンテック・ベンチャーに関する有識者会議」を開催している。2016年6月14日に開催された第2回会議では、人工知能(AI)研究の第一人者である松尾豊氏が「人工知能の動向と金融との関係」と題してプレゼンテーションを行った。本稿では、その内容をレポートする。

●第3次ブームにある「人工知能」

 松尾氏は、「現在、人工知能は第3次ブームの時代にある」と話を切り出した。第1次人工知能ブームは1960年代の推論・探索の時代。80年代の第2次人工知能ブームである知識表現の時代を経て、2010年代の現在の第3次ブームは機械学習、ディープラーニング(Deep Learning)の時代だ。

 「ディープラーニングにより、十数年できなかったことが、この2、3年、急速にできるようになり、破壊的なイノベーションが起きている」と松尾氏は言う。 ディープラーニング革命は【1】画像認識【2】運動の習熟【3】言語の意味理解――の順で進んでいる。

 【1】の画像認識の難しさを理解するために、例えばイヌ、ネコ、オオカミをコンピュータで見分ける場合を考えてみる。

 「耳が垂れている、目が長い→イヌ」「耳がとがっている、目が丸い→ネコ」「耳がとがっている、目が長い→オオカミ」となる。しかし、これらの判断には必ず例外があり、それをコンピュータに教え込むのが難しい。だが、人間はなぜかうまく判断できる。

●ディープラーニング(Deep Learning)とは

 ディープラーニングでは、コンピュータ自身が“特徴”を認識していく。その結果、認識の精度は2012年以降、桁違いに向上し、2015年2月にコンピュータは画像認識でエラー率3.6%を達成し、人間の精度を超えた。

 2013年以降は「ディープラーニング+強化学習」による運動の習熟が進んでいる。「強化学習とは、報酬が与えられると行動を強化すること。『“ご褒美”がもらえると、もっと頑張ろうとなる』状態のことだ。これは古くからある技術だが、これまでは状態を人間が定義してきた」(松尾氏)が、状態の認識にディープラーニングを使うことがミソだ。

 つまり、「“状態”を、どう認識するか」をコンピュータが自ら学習した上で、状態と行動をセットにして学ぶことが可能となったという。

 2016年、人工知能を使った囲碁プログラムの「AlphaGo」がプロ棋士に勝ったが、そのプログラムを開発した英ディープマインド(グーグルの子会社)はブロック崩しのゲームで画像を入力するだけで人工知能が試行錯誤を繰り返し、ゲームのコツを学び、人間を上回るハイスコアを出した。

●「ディープラーニング+強化学習」の実世界への適用

 2015年以降はこうした「ディープラーニング+強化学習」が次々と実世界へ適用されている。例えば、2015年5月には米カリフォルニア大学バークレー校において試行錯誤で部品の取り付けを習得するロボットが開発された。

 その他、試行錯誤で運転を習熟するミニカーの開発(プリファード・ネットワークス、日本)や、試行錯誤でピッキングが上達するロボットの開発(プリファード・ネットワークス/ファナック、日本)、米メリーランド大学、EUのプロジェクトも進展した。ファナックのケースでは、同社が十数年かけて開発したロボットによるピッキング作業の精度を、「ディープラーニング+強化学習」はたった数カ月の学習で上回ったそうだ。

 松尾氏は「これらの運動能力は人間のような高度な思考能力が必要なのかというと、そうではない。イヌでも投げられたフリスビーを上手にキャッチできるようになる」と解説する。問題なのは“認識”で、歴史的には多数の人工知能研究者が、このことを主張してきたという。

●文と画像を創る

 次の発展は言語の意味理解だ。意味理解というと翻訳を思い浮かべるが、「従来の自動翻訳の仕組みは文の意味を理解するのではなく、単に文字列を置き換えているにすぎない。ところが2014年以降、画像から意味を理解し、言語に置き換える作業ができる『Automated Image Captioning』が登場してきた。写真・画像を投入するとその画像・写真の内容を記述する文を生成する」と松尾氏は解説する。

 また、その逆に、文を投入すると画像を描く「Generating Images」が2015年12月に登場している。「A very large commercial plane flying in blue skies.」という文の「blue」を「rainy」に変えると、画像が青空から雨空に変わる。これはコンピュータが画像を替えているのではなく、「コンピュータが絵を描いている。これは正に、“われわれが子どもの頃に、お話を聞きながら、その情景を頭の中に描いた”のと同じ作業をコンピュータが行っていることを示している」。

 これを翻訳に応用すると、画像を介した翻訳となり、意訳となる。「今までとは全く異なる翻訳だ。もちろん、まだ静止画で画像も粗い。また抽象的な文章が対象となると翻訳が難しいなどの問題はあるが、このような手法によって意味理解、自動翻訳が可能となるのではと考えている」と松尾氏は見通している。

●「子どもの人工知能」と「大人の人工知能」

 加えて松尾氏は「子どもの人工知能」と「大人の人工知能」について説明。ひと言でいうなら、「特徴量の設計を人間が行わなければならないのが『大人の人工知能』、特徴量の設計をやらなくてよいのが『子どもの人工知能』だ」とする。

 「大人の人工知能」とは、ビッグデータから人工知能へという持続的イノベーションのことを指す。従来、データを集めることができなかった領域において、ビッグデータの出現によりデータが集積可能となった。そこに昔からある人工知能技術を応用することだ。これは一見すると、すごいことを行っているように見えるが、実は裏で人間が特徴量の設計を作り込んでいる。「大人の人工知能」はネット広告など販売・マーケティングの分野で活用されてきたが、今後は医療や金融、教育などの分野での利用が期待されている。

 一方、「子どもの人工知能」とはディープラーニングを突破口とする破壊的イノベーションのこと。子どもができることが人工知能で可能になっている。人間の発達と同様の技術進化、つまり認識能力の向上、運動能力の向上、言語の意味理解という順で技術が進展する。現状は、ものづくりに応用されているという。

●人工知能と産業分野

 松尾氏は日本の社会的な課題に対して人工知能が活用できる分野として、下図のような例を示した。

 金融における人工知能の活用を考えると、「大人の人工知能」としてビッグデータを活用することで、資産運用、トレーディング、融資・与信、保険の料率、販売促進などの分野に人工知能技術の入り込む余地は大きい。また、画像データの活用も可能性が大きい。人の表情を読み取って融資を行ったり、信用度を推定したりなど、人間が見て分かることがコンピュータも判断できるようになり、さまざまなアイデアが広がってくる。さらに、自動運転など自動化する社会での保険や金融商品への応用が広がってくる。これらの商品設計には複雑な数学が使用されているが、ここにも人工知能の応用が期待される。

 ただし、一番大きな可能性を持っているのは自動翻訳で、「金融市場の動向を、どのように捉えて理解していくか」について人工知能を活用できるとした。

●産学連携に向けた課題

 最後に松尾氏は、産学連携に向け日本の大学の課題として、これまで30社以上の企業と共同研究・連携を行ってきた経験から、「日本は海外に比べ大学側が企業活動を理解していない。大学側は自己満足の研究に終わらず、企業側の売上、利益にどうすればつながるのか意識を変革する必要がある。また企業側も研究活動への理解を示す必要がある」と結んだ。

[丸山隆平,@IT]

最終更新:7月14日(木)6時10分

@IT