ここから本文です

AI-OCR、医療、監視――広がる画像認識の可能性

8/21(水) 7:10配信

ITmedia NEWS

 ビジネスに役立つAIの基礎知識について分かりやすく解説する本連載。これまでAIの仕組みや歴史、各国の取り組みなど、さまざまな角度から「AI」というテクノロジーについて考えてきた。

保険業界にもAI(画像)

 本記事以降では、AIの具体的な応用例やアプリケーションについて見ていきたい。憶測や理想論で語られがちなAIだが、現時点では実際にどのようなアプリが実用化されているのだろうか。今回は、画像認識の分野について考えてみたい。

そもそも画像認識とは?

 画像認識、あるいは映像認識とは文字通り、静止画や動画を分析し、そこに何が映っているのかを把握する技術だ。認識する対象は文字や動植物、商品のブランドなど多岐にわたり、動画内から特定の行動(動き)を把握するといった取り組みも行われている。

 もちろん、必ずしもAIを使つ必要はない。ジェットエンジンがなくても、プロペラ機や気球が空を飛べるのと同様に、AI以外の画像認識技術も使われてきた。

 例えば文書の画像からその中にある文字を読み取るOCR(光学文字認識)は、20世紀初めから研究が始まっており、日本でも国産のOCR機が1968年に発表されている。そのためAI技術を活用したOCRは「AI-OCR」と呼ばれている。

 画像認識は現在の「第3次人工知能ブーム」を象徴する分野といえるだろう。本連載の第2回で解説したように、現在のAIブームを後押しするのは機械学習、特にディープラーニングの技術だ。

 ディープラーニングでは、人間が事前に「こういう特徴があればそこに映っているのは猫」というルールを設定したり、対象物が持つ特徴をどう処理するか設計したりする必要がない。そのため画像認識のように、事前の設定・設計が難しい分野で威力を発揮する。

 2012年にGoogleが発表した、「ディープラーニングで画像内の猫を認識する」例を考えてみよう。人間なら多くの人が猫を簡単に認識できるだろう。チワワの写真を目の前に出されて「これは犬? それとも猫?」と急に聞かれても、大部分の人は「犬」と答えるはずだ。

 しかしなぜチワワを犬と判断できるか、言語化することは非常に難しい。猫の瞳は特徴的で、明るい場所では線のように細くなるが、暗い場所で撮影された写真であれば猫も犬も丸い瞳だ。

 大部分の猫は犬より小さいが、犬でもチワワのように小さい種類があるし、猫でもメインクーンのように体長が1メートルを超えるものがある。そして爪を引っ込められるかどうかは、静止画では判断できない。

 人間は「こういう条件がそろえば猫」というようなルールで判断しているわけではなく、生きていく中で得られた膨大なデータ(経験)の中から「猫とはこういう生き物だ」というパターンを認識している。

 従来の技術では、そうした認識の仕方を実現することが難しく、画像認識の精度は低いままだった。しかし、ディープラーニング技術が登場したことで、機械に大量のデータを与え、機械自体に対象物の特徴や処理のルールを考えさせることが可能になった。精度の高い画像認識アプリの実用化が進んだのである。

1/4ページ

最終更新:8/21(水) 7:10
ITmedia NEWS

こんな記事も読まれています

あなたにおすすめの記事