ここから本文です

本番環境でも使い続けられるデータ分析環境--de:code 2018より

7/12(木) 7:00配信

ZDNet Japan

 日本マイクロソフトは5月22日から23日の2日間、都内で開発者向けカンファレンス「de:code 2018」を開催した。本稿では170を超えるセッションから、「組織のデータ活用術~Power BIとAzure Machine Learningではじめるデータ解析実践編」の概要を紹介する。

 多くの方は社内に蓄積した各種データをAI(人工知能)技術で活用したい、と考えているだろう。だが、バズワード化したAIを正しく理解している人はさほど多くない。本来AIは音声や画像認識、情報検索、推論など多岐にわたる範囲を包括する概念であり、その中に機械学習、その手法の1つとして深層学習がある。

 だからこそデータを学習してモデルを作り、それを使って予測や分類を行う機械学習が核となるものの、データの質に応じて、予測精度は大きく変化する。「データ量を増やせば自然に賢くなると思いがちだが、必ずしもそうではない。整理し、分析に足るだけの多面的なデータ」(望月氏)を用いることで、初めて"地頭の良い"学習モデルを生成できる。
 他方で機械学習に用いるツールが増えても、統計的な相関結果を出力しているに過ぎないため、ビジネスの現場で利用するには、従来のデータ分析と同じくデータセットの準備や、モデリングといった調整は人が関わらなければならない。

 結局は「データの分析知識が必要」(望月氏)なのである。これらの状況を踏まえて望月氏は、「AIは手段であって目的でない」「AIは魔法の箱ではない。AIを生かすも殺すもデータ次第」「どんなデータが必要か、どんな手法を使えば良いか検討して準備するのは人」と強調した。

 データ分析を概念として捉えると諸説出てくるが、望月氏は「データから価値のある意味を見出すこと」と定義する。「(ビジネスの理解を前提とした)分析の目的」「必要なデータ収集と傾向の理解」「データ準備・加工」「収益・分析」「モデル作成・評価」「結果評価」「施策立案・実行」という工程を踏み、仮説検証を行う可視化から発見、そして予測という分析を並行して行う。

 そのため、「場合によってはデータの見直しなど、試行錯誤のアプローチが必要。データ分析を依頼する側も実践する側も、その意識を持って取り組まなければならない」(望月氏)。AIや機械学習という文脈では、データサイエンティストの存在が欠かせないものの、こちらもAIというキーワードと共にバズワード化する傾向があるという。日本マイクロソフトは、「Pythonが書ける、分析ツールが使えることが重要ではない。ビジネス視点で分析結果を可視化して報告し、施策に落とし込める」(望月氏)のが真のデータサイエンティストと断言した。

最終更新:7/12(木) 7:00
ZDNet Japan