ここから本文です

AIに不可欠な機械学習の仕組みとFinTech活用での注意点

ITmedia エンタープライズ 7月5日(火)17時42分配信

 本連載の第19回で、オープンイノベーションの観点から「FinTech」(金融×IT)を取り上げた。ビッグデータ分析の中核技術として脚光を浴びているのが、人工知能(AI)だ。

【その他の画像】

●FinTechの様々な領域で活用されるAI技術

 AIは、多量のデータから自律的に判断性能を向上させる仕組みにより、人間の知能を有するかのように機能するマシンやシステムのことを指す。具体的な構成要素としては、知識・概念の集積と、入力データを処理し、知識・概念と照合し推論を行うロジック(エージェント)がある。

 AIは、FinTechのさまざまな領域で適用されている。例えば、複数の金融機関の口座に分散した残高や取引に関する情報を集約する個人資産管理の領域では、家計簿ソフト、アカウントアグリゲーション、モバイル請求・支払管理などの基本的機能に加えて、AIによるビッグデータ分析を活用しながら、リアルタイムで与信スコアリングシステムを提供する機能が導入されている。

 インターネットやモバイルアプリケーションを通じて個人投資家向けに資金運用支援サービスを提供するロボアドバイザーの領域では、個々の投資家の年齢、年収、投資目的、リスク選好、過去の投資履歴などのデータを収集し、AIを駆使したアルゴリズムを利用して最適な資産投資アロケーションを提示するとともに、投資家の運用方針や金融市場環境の状況に応じて、金融商品の売買を代行する自動化機能の開発・導入が行われている。

 個人と個人をインターネットで結んで金銭貸借を行うピア・ツー・ピア(P2P)レンディングの領域では、マーケットプレイスに参加する借り手・貸し手の信用度を、AIベースの分析アルゴリズムでリアルタイムにチェックする機能の開発・導入が進む。

 また、不動産投資分野のFinTechでは、不動産物件情報や地域の地価動向、不動産売買履歴、外部データなどを統合・集約し、AIベースのアルゴリズムモデルでリアルタイムに不動産物件に関する査定情報を提供する機能が導入されている。

●FinTechを牽引するビッグデータと機械学習による最適化

 AIは、FinTechのスタートアップ企業のビジネスモデルに欠かせない存在であり、AIを構築する上で、大きな役割を果たしているのが、機械学習(Machine Learning)技術だ。機械学習は、コンピュータが自動的にパターンを学習し、データから推論を行う機能であり、大規模な多次元構造のデータから自動的に知見を導くことを可能にする。下記の図1は、機械学習アルゴリズムの分類を示している。

 機械学習を大別すると、第1に入力データを与えられた目標値、またはクラスラベルにマッピングする「教師あり学習(Supervised)」がある。代表例は、多項式回帰(Polynomial Regression)、多変量適応型回帰スプライン(MARS)、決定木(Decision Trees)、ナイーブベイズ(Naive Bayes)、サポートベクターマシン(Support Vector Machines)などだ。

 第2に、人間によるラベルのマッピングを必要とせずに入力データの隠された構造を学習する「教師なし学習(Unsupervised)」がある。代表例は、K-Meanクラスタリング(K-Mean Clustering)、ガウス混合モデリング(Gaussian Mixture Modeling)、主成分分析(Principal Component Analysis)などである。

 第3に、少量のラベル付けされたデータを大規模のラベル付けされていないデータに融合させて適切なアルゴリズムに近づける「半教師あり学習(Re-enforcement)」がある。代表例は、能動学習(Active Learning)、共訓練(Co-training)などだ。

 第4に、報酬の最大化を図るために観察と行動の間のマッピング関数を学習する「強化学習(Semi-supervised)」がある。代表例は、マルコフ決定過程(Markov Decision Process)、Q学習(Q-Learning)などであり、ロボットを利用した強化学習も含まれるが、ビッグデータ分野での適用は限定的な段階にある。

 そして、ビッグデータ分析のために選択した機械学習ツールを評価するための基準として、下記のようなパラメータがある。

・正確性:与えられた分類と推測が、新しいデータまたは従来見えていなかったデータのクラスラベルと価値を正しく予測するための能力
・速さ:与えられた分類と推測を生成し、利用するのに必要なコスト
・堅牢性:ノイズの多いデータや値が不足したデータから、正確な予測に導くための分類や予測するための能力
・拡張性:与えられた大量のデータを効率的に分類や予測するための能力
・解釈可能性:分類や予測によって提供される理解と知見のレベル

 伝統的な金融分野のビッグデータ分析では、上記のような機械学習アルゴリズムを、時系列データに対して適用させることが多い。FinTechの場合、異業種・異分野で培われたナレッジ/ノウハウを生かしながら、時系列データのほか、グラフデータ、空間データ、マルチメディアデータなど、さまざまなタイプのデータと機械学習アルゴリズムを組み合わせて、新たなイノベーションを生み出そうと切磋琢磨している。

●ビッグデータアプリケーションプロバイダーとしてのFinTech

 本連載の第21回で紹介した米国立標準研究所(NIST)のビッグデータ相互運用性フレームワーク(下記の図2参照、関連情報PDF)からみると、AIの活用によるビッグデータ分析に特化したFinTechスタートアップ企業は、機械学習に必要なデータの収集から、準備/キュレーション、分析、可視化、アクセスまでのプロセスを担う「ビッグデータアプリケーションプロバイダー」に位置付けられる。

 「ビッグデータアプリケーションプロバイダ-」としてのFinTechは、データの種類や送受信の頻度、セキュリティ/プライバシー要件(ポリシー、ユーザー認証/承認/アクセス制御など)がまちまちな「データプロバイダー」や「データコンシューマー」、さらにはHadoop、NoSQLに代表されるデータ基盤をクラウド型/オンプレミス型で提供する「ビッグデータフレームワークプロバイダー」と相対しながら、共通のインタフェースやAPIを開発・導入し、ユーザーエクスペリエンス(UX)を高めていかねばならない。特にAIの場合、ちょっとしたノイズやシステム障害でも分析結果に影響が出る可能性があり、注意が必要だ。

 図3および下表は、「ビッグデータアプリケーションプロバイダー」が「データプロバイダー」や「データコンシューマー」「ビッグデータフレームワークプロバイダー」と連携するエコシステムに置いて、セキュリティ/プライバシー対策上留意すべき点を例示したものだ。

 金融ビッグデータ分析のエコシステムにおけるセキュリティ/プライバシー対策では、「ビッグデータアプリケーションプロバイダー」とそれを取り巻くさまざまなプレイヤーとの間を調整する「システムオーケストレーター」役を誰が担うかが極めて重要である。

 スタートアップ企業単独では、エコシステム全体の調整役を果たすことが難しい反面、規制当局や既存の大手金融機関が主導してITリスク管理に重点を置き過ぎると、FinTechによるイノベーションが阻害される可能性がある。FinTech各領域におけるイノベーションのライフサイクルに応じて、エコシステム全体でコンセンサスをとりながら、アクセルとブレーキを踏み分ける仕組みをつくることが、競争力強化に必須な要件となるだろう。

 次回は、英国の欧州連合(EU)離脱問題がビッグデータに及ぼす影響について考察する。

●著者者紹介:笹原英司(NPO法人ヘルスケアクラウド研究会・理事)

宮崎県出身、千葉大学大学院医学薬学府博士課程修了(医薬学博士)。デジタルマーケティング全般(B2B/B2C)および健康医療/介護福祉/ライフサイエンス業界のガバナンス/リスク/コンプライアンス関連調査研究/コンサルティング実績を有し、クラウドセキュリティアライアンス、在日米国商工会議所などでビッグデータのセキュリティに関する啓発活動を行っている。

Twitter:https://twitter.com/esasahara

LinkedIn:https://www.linkedin.com/in/esasahara

Facebook: https://www.facebook.com/esasahara

日本クラウドセキュリティアライアンス ビッグデータユーザーワーキンググループ:

http://www.cloudsecurityalliance.jp/bigdata_wg.html

最終更新:7月5日(火)17時42分

ITmedia エンタープライズ