ここから本文です

文系でも分かる「機械学習」のススメ 教師あり/なし、強化学習を解説

5/23(木) 7:00配信

ITmedia NEWS

「教師なし学習」とは

 教師なし学習では、機械に大量のデータだけを与えてその中にある隠れた規則性を発見させる。こちらも前回記事の例だが、ECサイト上の大量の取引データから、同じような購買パターンを持つクラスタ(集団)を把握するとしよう。

 この場合、ユーザーをあらかじめ「40代男性」「東京に住むサラリーマン」のように分類しておき、彼らがiPhoneを買う傾向があるかどうかを判断するといった手法を使うこともできる。

 だがそれでは、事前に人間が考えた分類でしか分析することができない。例えば「マイルドヤンキー」といった具合に、新しい社会グループの存在が日々発掘され、概念化されているが、そうした未知の概念に気づかない可能性が出てくるわけである。

 しかし教師なし学習の場合には、機械が自ら適切なクラスタの分け方を導き出してくれる。実際にこうしたクラスタ分析と、それを活用した商品レコメンデーションは、多くのECサイトが導入している。

 いまは「第3次人工知能ブーム」の時代といわれている。このブームのきっかけになったと考えられている出来事がいくつかあるのだが、その1つが2012年の「Googleによる猫画像認識」である。

 覚えている方も多いと思うが、これはAIに大量の画像データを与えることで、人間が教えることなく、AIが自発的に猫を認識することに成功したというものだ。実はこの際に使われた手法も、教師なし学習だった。

 このときGoogleは、YouTube上に投稿された動画の中からおよそ1千万枚の画像を無作為に抽出し、そこに何のラベルもつけずに(つまり「教師データ」の状態にはせずに)彼らが開発したアルゴリズムに与えた。するとこのアルゴリズムは1週間後に、画像の中に猫が映っている場合、そこに猫がいると正しく分類できるようになったのである。ただし機械に「猫」という言葉は教えていないので、正確には「猫に相当するグループ」を分類できたことになる。

 このニュースは世界に衝撃を与え、教師なし学習に対する注目が一気に高まった。

 教師なし学習は画像分析や映像分析、音声分析などの分野でその精度や用途を大きく前進させるために活用されている。またセキュリティの分野で、未知の脅威を検知するAIを開発することにも役立てられている。不正検知などでは過去のデータから異常な取引のパターンを学習させているが、それでは新しい手口に対抗できない。教師なし学習であれば、クラスタ分析のように人間がまだ気づいていない概念にも対応できるわけである。

2/3ページ

最終更新:5/23(木) 7:00
ITmedia NEWS

こんな記事も読まれています

あなたにおすすめの記事