ここから本文です

機械学習のモデル作成/実装を自動化、半年の工程を1週間に短縮

MONOist 7月13日(水)7時40分配信

 新日鉄住金ソリューションズは2016年7月11日、東京都内で会見を開き、同年7月1日から国内向け販売代理店として取り扱いを始めた米国のDataRobotの機械学習プラットフォーム「DataRobot」の特徴や事業の方向性について説明した。同製品によって、これまで時間を要していた、機械学習アルゴリズムの選択などモデルの作成、実際のシステムへの配備、運用といった工程を自動化。数人のデータサイエンティストが半年から1年かけていた作業を1週間に短縮する。2019年までに30社に納入し、30億円の売り上げを目指す。

【機械学習をビジネスで使うまでのプロセスなどその他の画像】

●DataRobotとは?

 DataRobotは、機械学習活用の賞金付きビジネスコンペ「kaggle」のランキング上位に入賞したデータサイエンティストが2012年に設立した企業だ。56万人の参加者が競う中で1位になったメンバーが3人おり、最高経営責任者や創設者も20位に入賞した。本社を米国マサチューセッツ州ボストンに置く。DataRobotの日本支社にはリクルートが出資している。新日鉄住金ソリューションズは、システムインテグレーターとして日本では初めて販売代理店となった。

 機械学習プラットフォーム「DataRobot」は、データサイエンティスト個人に依存したノウハウや技術をさまざまな分野で広く使えるようにする目的で開発したソフトウェアだ。機密性の高いデータを扱うことを踏まえ、オンプレミスでのデータ処理に対応している。

 同ソフトは、商品の需要予測などに使う回帰分析や、ローンの与信判定など可否を判断するクラス分類といった処理を得意とする。価格の推移を予測するような時系列処理や画像認識の機械学習には対応していない。

 新日鉄住金ソリューションとDataRobotは、ビッグデータの分析精度を競う世界大会「KDD2015」がきっかけとなって協業に至った。「同大会で当社は2位、DataRobotは3位だった。もしもっと早く協業していれば1位になることも難しくなかった。この大会が全てではないが、組んでできることが多いと互いに考えるきっかけになった」(新日鉄住金ソリューションズ ソリューション企画・コンサルティングセンター 企画グループリーダーの三橋利也氏)。

●機械学習を活用するまでに時間がかかるところ

 機械学習をビジネスで活用するためには5つのプロセスがある。まず、業務や経営の知識に基づいて課題を定義し、改革の方針などゴールを定める。次に、課題と関連の深い変数を設定し、学習用データを定義。そして、必要なデータを収集し、機械学習のアルゴリズムに合わせてデータを加工するが、データの収集/加工は長時間の作業を要する。

 その後、さまざまな機械学習のアルゴリズムの中から最も高精度なモデルを選択し、実際のシステムに落とし込むといった工程がある。1人のデータサイエンティストが検討できる予測モデルの数は限りがあり、データサイエンティストの人数や作業時間を増やしても効率化には限界がある。

 変数を追加するなどして学習用のデータの収集/加工のやり直しが発生し、これに合わせてアルゴリズムの選択を繰り返すことも珍しくない。これによりさらにリードタイムが長期化する。

 DataRobotは、同社社内のデータサイエンティストのノウハウを基に、モデルの選択/作成/実装を自動化した。データサイエンティストが人力で先述の作業を行うのと比較して、10~100倍の規模/速度で作業を進めることができるとしている。「世界トップクラスのデータサイエンティストを何人も雇うのと同じことがソフトウェアで実現できるイメージだ」(DataRobot ビジネスディベロップメントの原沢滋氏)。

●ドラッグ&ドロップとワンクリックで完了

 DataRobotの操作はシンプルだ。学習用のデータをまとめたExcelなどのファイルをドラッグ&ドロップでアップロードし、機械学習で分析したい項目を選択するだけで完了する。統計処理の手法を詳細に設定することも可能だが、初期設定でも最適なモデルを選択するという。バラつきがないデータや、IDなど機械学習に適さないデータは自動的に除外して分析する。

 これまでは「モデルづくりに半年から1年、モデルを決めた後に実際のシステムに組み込むのも半年から1年要していた。機械学習を実際のビジネスに活用するには、早くて1年、長ければ2年かかっていた。これを、1日から1週間単位で終えることができる」(原沢氏)としている。

 モデルの作成/実装を自動化して機械学習導入の負担を軽減するだけでなく、その前工程である課題の明確化や機械学習用データの定義、データの収集や加工といったプロセスについても、新日鉄住金ソリューションズが抱えるデータサイエンティストが支援していく。

最終更新:7月13日(水)17時56分

MONOist