ここから本文です

元組み込みエンジニアの農家が挑む「きゅうり選別AI」 試作機3台、2年間の軌跡

3/12(月) 9:34配信

ITmedia エンタープライズ

 漬物やサラダ、おつまみなど、食卓に一年中出てくる「きゅうり」。その収穫量は年間約55万トンにものぼり、日本全国で栽培されている。しかし、その仕事は、他の作物を作る同業者からも「大変ですね」といわれるほど、過酷な面があるという。

ディスプレイ上に設置したテーブルにきゅうりを乗せると、自動で等級や長さが表示されるマシン

 「昨今の農業は機械化が進んでいるものの、きゅうりやなす、トマトといった果菜類(果実を食用とする野菜)については、まだまだ手作業が多く、作業効率が低いのが現状です」

 こう話すのは、静岡県できゅうり農家を営む小池誠さんだ。家族経営で年間約21万本(63トン)のきゅうりを出荷しており、収穫がない夏以外は、多忙を極めている。きゅうり栽培が大変なのは、手作業による収穫もさることながら、出荷に必要な時間も膨大なのが原因の1つだ。これだけで栽培における全労働時間の5分の1を占めるという。

●1日4000本のきゅうりを手作業で仕分ける、母親の負担を軽くしたい

 その代表的な作業が「仕分け」だ。きゅうりの仕分けとは、出荷時に傷や病気があるものを除いたり、形や色合い、大きさによりランク別に選別する作業のこと。特に統一の規格があるわけではなく、各農家によって独自のルール(出荷先の希望や市場での価格などで決める)が存在する。

 小池さんの家では、出荷時にきゅうりを9種類に選別しており、収穫のピーク時には1日約500キロ(約4000本)ものきゅうりを仕分けることもある。規模の小さい個人農家では、大掛かりな仕分け機を買うメリットが少ないため、手作業にならざるを得ないそうだ。仕分け担当である小池さんの母親は、1日8時間以上ずっとその作業に追われることもあったという。

 「1つとして同じ形のきゅうりはありません。形や大きさ、表面のツヤ、曲がり具合、太さの均一さなど、確認するポイントが非常に多く、また、選別する等級を間違うとクレームにつながることもあるため、忙しいときだけバイトを雇って手伝ってもらう、といった手段も取りにくい。何より問題なのが、この作業に時間をかけても、別にきゅうりの収穫量や品質が上がるわけではないということ。なるべく時間を減らしたい作業なのです」(小池さん)

 何とかして母の負担を軽くできないか――。この課題を解決しようと小池さんが動いたのは2016年のこと。Google DeepMindが開発したコンピュータ囲碁プログラム「AlphaGo」がプロ棋士を破ったのを見て、ディープラーニングによる画像解析の可能性を感じた小池さんは、Googleがオープンソースで公開している機械学習用のソフトウェアライブラリ「TensorFlow」を使って自動仕分け機を作れないかと考えた。

●初めてのディープラーニングでいきなり80%の精度

 小池さんはもともと、自動車部品メーカーのソフトウェアエンジニアだったこともあり、すぐにTensorFlowのチュートリアルを流用する形でシステムを組み上げた。「無料で学べる動画なども充実してきていますし、昔に比べて学びやすい環境が整っていると思います」(小池さん)

 厚紙にきゅうりを乗せ、アルミパイプで固定したWebカメラで撮影。その画像を3層の畳み込みニューラルネットワーク(CNN=ディープラーニングにおけるアルゴリズムの一種)で識別するというシンプルなものだ。ソフトウェアがオープンソースであるため、かかったコストはWebカメラを含めても3000円程度。ニューラルネットワークが3層と少ないためGPUも必要なく、ノートPCくらいのスペックでも問題なく動いたという。

 教師データには、熟練者が仕分けしたきゅうりの写真を2475枚(選別したい9つのランクで各275枚)集めた。そして275枚の画像でテストしたところ、正答率が80%だった。意外といける――。そう感じた小池さんは、すぐに次なる試作機の開発に着手した。

●より、人間の判断に近づけた「試作2号機」

 続く試作機で小池さんが目指したのは、より人間の仕分けに近づけるという点だ。最初の試作機では、撮影するカメラが1台だったのに対し、今回はUSBカメラを3つに増やし、きゅうりを上、下、横から撮影。照明もつけて明るさを一定にするようにした。アルミフレームでアクリル板を固定するなど、装置は大きくなったが「かかった費用は2万円程度だった」と小池さん。

 CNNにおける隠れ層も4層に増やしたほか、教師データの解像度を高め、数も増やした。TensorFlowの動作環境もノートPCからRaspberry Piに変えたという。2カ月ほどかけて上、下、横の画像を7000組用意し、1500組の画像でテストを行ったところ、正答率が90%以上にまで向上した。さらに小池さんは、AIが判断したきゅうりを指定の箱まで運ぶベルトコンベアも自作。仕分けの完全自動化を達成したのだ。

 しかし、完成した試作機を実際に動かしてみたところ、多くの課題があることが分かった。画像の読み込みに使った解像度では傷や艶といった要素を認識できないほか、周囲の環境が認識に影響を与えてしまい、精度が約70%程度にまで落ちてしまった。仕分けから箱詰めまでのスピードもまだまだ足りない。

 画像を増やしたことで、収穫時期によって形や太さに偏りがあったことも分かった。熟練した人間であれば、無意識のうちにこうした誤差を踏まえてランク付けを行うが、人工知能ではそうもいかない。そして、何よりベルトコンベアによって、きゅうりにキズがつくことが分かり、現場には導入できないという判断になったという。

●「自動化」から「人間のサポート」へ方針変更

 スピードの向上や、きゅうりを傷めることなく機械に仕分けさせるには、開発が難しいしコストもかさむ。小池さんは「仕分け作業の完全自動化」という方針をやめ、「AIによる人間のサポート」というコンセプトに変更した。等級の判断のみをAIに任せ、箱詰め作業は人間が行うという“分業”にしたのだ。

 開発した「試作3号機」は、ディスプレイ上に設置したテーブル(アクリル板)にきゅうりを乗せ、きゅうりが置かれた場所に等級を表示するという仕組みだ。CNNも5層に増やし、きゅうりの長さや表面積、太さといったデータも入力するようにした。季節ごとに変わる傾向の誤差を吸収(調節)できるようにするためだ。

 教師データ用に集めた画像は2万8000枚。画像処理でテーブル上のきゅうりを画像を切り出すようにしたため、一度に10本ずつ撮影でき、作業は1カ月ほどで済んだとのこと。8000枚の画像でテストを行ったところ、精度は約80%だったという。試しに小池さん自身が実務で使ってみたところ、仕分けのスピードが約40%上がった。

 実環境で851本を判定したところ、正答率は73.3%だった。小池さんとしては「B品(品質が1ランク低いもの)の正答率が低い」ことが課題で、調整を続けていく考えだが、これ以上学習に利用するデータを増やしても、精度が上がりにくい状態になっており、コストパフォーマンスとの兼ね合いに悩んでいる。今後は、認識速度の向上にも取り組んでいくという。

●完璧じゃなくても、十分役に立つ――農業×ディープラーニングの可能性

 人工知能の開発を続けて約2年。小池さんはさまざまな気付きがあったと振り返る。まずは「熟練の技術を仕様に落とし込むのは難しい」ということだ。基準が複雑であるため、上手く言葉に表すのが難しく、個人のこだわりによる部分もある。小池さんは、「だからこそ、現状のデータから学んでいくディープラーニングは適しているように思う」と強調する。

 農業ならではの注意点もある。品種や季節、栽培方法によって作物の形は変わるという点だ。少なくとも1年間分はデータを集める必要があるし、各要素が変わったときの差を調整する仕組みも必要になるという。

 ディープラーニングを使用するには、良質なデータを大量に集める必要があるため、100%に近いレベルの精度を出すのは、コストや時間がかかる作業だ。しかし「無理に完璧を目指さなくてもいい」というのが小池さんの考えだ。

 「実際に7割~8割くらいの精度でも、作業効率が向上しました。ディープラーニングは“天才”じゃなくても、ある程度の精度が出せる技術だと言えます。だからこそ専門家じゃない人間こそ、どんどん試すべきだと思っています」(小池さん)

 現在はきゅうりの自動収穫を目指して、畑の中から栽培中のきゅうりを検出する実験をしたり、地元の町工場の人々にディープラーニングを教えているとのこと。小池さんのあくなき挑戦とエンジニア魂は、個人のアイデア1つでイノベーションが生まれる可能性を感じさせる。