ここから本文です

機械学習の導入で「文学の研究」が大きく変わり始めている

8/18(日) 15:11配信

WIRED.jp

いま英語圏の文学研究者たちは、研究にデータやアルゴリズムを活用しはじめている。この新しいアプローチは、研究の内容や学生の専攻を変えるのみならず、文学研究の対象をソーシャルメディアやファンフィクションなどにまで大きく拡大させている。

無名の作品にもスポットライトを

SFの定義は曖昧なことで有名だ。小説家とその代表作によって決まると考える人もいる(その始まりについて、1870年に出版されたジュール・ヴェルヌの『海底二万里』だとする人もいれば、さらにさかのぼって1818年に出版されたメアリー・シェリーの『フランケンシュタイン』とする人もいる)。

あるいは、重要なのは作者ではなくアイデアだとする考え方もある。例えば、SF百科事典の『Encyclopedia of Science Fiction』は、SFを「認識異化(cognitive estrangement)の文学」と呼んでいる。

だが、大量の書籍のデータをコンピューター処理することで、もっと確実な答えが得られるとしたらどうだろうか? いま、英文学の世界にデータをもちこもうという取り組みが拡大している。

物語の「予測可能性」を解明する

同じ分野を研究している研究者のなかには、機械学習によって小説で「次に来るフレーズ」を予測できるか試している者もいる。カリフォルニア大学バークレー校のデヴィッド・バンマンは、音声アシスタントなどに使われる自然言語処理(NLP)を利用して、物語にどの程度の「予測性」があるかを研究中だ。

彼の研究では、ある言語モデルにSF小説の前半を読ませ、次の段落を予測させている。その予測結果とオリジナルとの類似性を見つけることで、作家やジャンルを「予測可能」にする基本要素を解明できるというのだ。

バンマンの現在のプロジェクトは、アマゾンから研究助成金を受けて行われている。その目的はNLPを進化させ、プロットの計算モデルを構築できるようにすること。つまり、コンピューターを利用して、複雑なコンセプトを登場人物や場所、出来事などの要素に分解するのである。

バンマンによると、英語とデータサイエンスというこのユニークな組み合わせを反映して、最近の大学では学生たちの専攻の決め方が変化しているという。英語とデータ科学の両方を専攻し、計算的な研究方法と経験的な研究方法の両方を学ぶ学生が増えているのだ。科学と文学の間にある障壁が、崩れつつある。

1/2ページ

最終更新:8/18(日) 15:11
WIRED.jp

記事提供社からのご案内(外部サイト)

『WIRED Vol.34』

コンデナスト・ジャパン

2019年9月13日発売

1,200円(税込み)

『WIRED』日本版VOL.34「ナラティヴと実装」社会実装の可能性を探るべく、2020年代の実装論を総力特集

こんな記事も読まれています

あなたにおすすめの記事