ここから本文です

ビッグデータ時代を生き抜くために――一生もののデジタルデータ解析解説書

9/12(木) 6:30配信

Book Bang

ビッグデータをめぐる期待と恐れ

 現代では新しいテクノロジーが次から次へと社会に導入されている。いま大きく話題になっているテクノロジーは人工知能とビッグデータである。これらに対する人々の反応は、どちらも実像を把握しにくいことから生じる過剰な期待と恐れである。

 人工知能については、より効率的な社会を実現してくれるのではないかという期待とともに、人工知能が人々の仕事を奪う可能性や人工知能による人々の選別問題、人工知能が人間の知性を超えるシンギュラリティ問題など、さまざまな恐れに満ちた言説が流布している。

 ビッグデータをめぐる言説も同様である。ビッグデータによる効率的なマーケティングや人間行動の非常に詳細な解析の可能性が語られるとともに、プライバシーの侵害やデータの独り歩きを懸念する言説も多くみられる。

 このような社会状況において、本書はビッグデータを含むデジタルデータとその収集・解析方法の実像を読者に提示してくれる。しかも重要なことは、本書が細かい技術的なことを扱っているのではなく、デジタルデータを用いた研究の根本的な考え方を丁寧に解説していることである。根本的な考え方を身に着ければ、新しい技術が出てきても、その本質を理解し使いこなすことができる。その意味で、本書は正に「一生もののデジタルデータ解析解説書」である。以下では、簡単に本書の構成を紹介し、本書の特徴を述べ、最後に本書の意義を検討する。

本書の構成

 本書は7章構成からなる。「第1章 イントロダクション」では、本書が質問紙調査のような従来型社会調査を行ってきた社会科学者とビッグデータのようなデジタルデータを扱うデータサイエンティストを結びつける意図を持っていることを明確に述べている。そして、企業や政府のような他者が作ったレディメイドのデータ(典型例は企業の保有するビッグデータである)と研究者が自ら作成したカスタムメイドのデータ(典型例は社会科学者が質問紙調査で収集した調査データである)の長所と短所を理解して、両者を組み合わせることの有効性を示唆する。

 「第2章 行動を観察する」では、まず社会調査データとは異なり、ビッグデータは企業や政府などが研究以外の目的で収集していることに読者の注意を喚起し、ビッグデータの10の特徴を述べている。これらの特徴には社会科学者にとって有益なものもあればそうでないものもある。これらの特徴を理解することで、ビッグデータの等身大の実像を把握できる。

 第3章から第5章まではデジタルデータを用いた社会科学的研究の具体例を示しながら、いかに研究を推進するかを分かりやすく解説している。「第3章 質問をする」では、従来型の社会調査の長所と(デジタル時代における)限界を述べ、ウェブ調査のようなデジタル調査の有効性を提示している。とりわけ興味深いのは「3.6 ビッグデータにサーベイを結びつける」で、この節では両者を結びつけることでデータ解析のさまざまな可能性が広がることを示している。

 「第4章 実験を行う」では、一般的な実験について解説した後、適切な実験計画に基づいたデジタルな実験ならば、低コストで大人数の被験者を対象として実験を行えることを示している。確かにデジタルデータにはサンプルのゆがみが伴う。しかし適切な実験計画で統制群と実験群を構築すれば、大人数の被験者を用いた厳密な実験を行うことができる。

 「第5章 マスコラボレーションを生み出す」では、オンライン上で多くの人々(専門家のみならず一般市民も)に自分の研究に参加してもらう方法を提示している。市民参加型のオープンサイエンスの可能性を感じさせる章である。

 「第6章 倫理」は必読の章である。私はかねてからビッグデータ解析における研究倫理について関心を持っていた。本章では、ビッグデータを含むデジタルデータを扱う際に生じうる倫理的問題を詳細に検討し、それらを解決する方策を提案している。

 「第7章 未来」は、タイトルどおり今後のデジタルデータ解析の未来について述べている。それは、レディメイドデータとカスタムメイドデータのブレンド、参加者中心のデータ収集、倫理の中心問題化である。そして「社会調査の未来は、社会科学とデータサイエンスのコンビネーションになるだろう」(367頁)という本書の最も重要なメッセージで終わる。

1/3ページ

最終更新:9/12(木) 6:30
Book Bang

記事提供社からのご案内(外部サイト)

こんな記事も読まれています

あなたにおすすめの記事