ここから本文です

アマゾンロボ競技会、勝敗分けた「30分」の選択 簡易な3軸ロボで勝利した豪州チーム

9/13(水) 15:25配信

日刊工業新聞電子版

■わずか30分で未知を既知に変えた

 ロボット業界で人工知能(AI)の重要性が増している。7月末に開かれた「アマゾンロボティクスチャレンジ」(ARC)ではロボットよりもAI技術が勝敗を分けた。ARCは物流倉庫での棚入れ棚出し作業のロボット化を競う。参加チームのほとんどが垂直多関節ロボットを採用する中、優勝したのはXYZの3軸直交ロボだった。各チームのロボットが注目される中、最も単純な装置と高速ディープラーニング(深層学習)を組み合わせた豪州チームが頂点に立った。

 2017年のARCの見所は未知物体への対応だった。アマゾン・ロボティクスのタイ・ブレイディ チーフテクノロジストは「15年の初回大会で吸引やグリッパーなど、つかむための把持機構が出そろい、第2回では深層学習による認識と把持機構の組み合わせを競った。17年は未知物体への対応が焦点」と振り返る。競技では扱うアイテムの半分が開始直前に与えられる。アイテムの半分は事前に深層学習で画像認識モデルを作れるが、もう半分は学習にかける時間が30分しかない。物流の現場では扱う商品が日々入れ替わるため、初めて見る商品に即応する能力を求めた。

 そこで多くのチームが30分間での深層学習を諦め、未知物体と既知物体で対応を分けた。三菱電機などのチームは既知物体は深層学習、未知物体は重量と色の特徴で判別。東芝などのチームは既知物体用の深層学習と未知物体用の簡易なAIを複数走らせて確度の高い判定結果を選んだ。

 対して上位チームは30分間での深層学習を選んだ。4位のインド工科大学などのチームは未知のアイテムを渡されると自動撮影機に投入、角度を変えて1アイテムごとに100枚の写真を撮る。このデータを8枚のGPUを搭載したGPUクラスターで深層学習した。メンバーは「20―25分で学習する。未知と既知で認識に違いはない」と説明する。細いブラシについたラベルを吸引するなど、吸引部位の識別もしていたようだ。

 優勝したオーストラリア・ロボティック・ビジョン・センター(ACRV)はあらかじめ学習モデルを用意し、直前に未知物体を学習させてモデルを精密に調整した。リーダーを務めたユーゲン・ライザー博士は「30分間の学習では精度は期待できない。そこで二つのカメラでダブルチェックして精度を上げた」と説明する。

 ACRVは一回戦は振るわず、二回戦に中位につけ、最終日に最高成績で逆転した。「初めはつかんだアイテムを落とすなど運がなかった。ただ同じ戦略のシンガポール(3位)やドイツ(2位)が好成績をあげ、我々の戦略は間違っていないと信じていた」と振り返る。上位チームは技術的に大きな差はなく、実力は僅差だった。三菱電機の技術者は「成績の差は認識の差。上位チームはたった30分で未知を既知に変えてしまった」とたたえる。

 ACRVの装置はロボットというよりも、ハンドがついた3軸機構だ。最も簡易なロボットで、AIを駆使して優勝した。実際、ロボットで把持しなくても商品を仕分ける装置はある。短時間での学習が実現すると混流コンベヤー上での認識・仕分けなど幅広い応用が広がる。