ここから本文です

TensorFlowを使った機械学習を論文抽出に適用、ヒントは大学入試問題対策の裏ワザ

2017/12/22(金) 8:15配信

@IT

 医師が診療ガイドラインの作成で根拠とする論文の抽出作業を自動化するため、自らディープラーニングフレームワークのTensorFlowを使い、機械学習によるテキストマイニングを行った。

診療ガイドラインは、クリニカルクエスチョン、推奨事項、解説、根拠となる文献で構成される

 これを行ったのは、東京共済病院腎臓高血圧内科部長、東京医科歯科大学臨床教授などを務める神田英一郎氏。日本腎臓学会の組織した委員会による、慢性腎臓病(CKD)をテーマとした「エビデンスに基づくCKD診療ガイドライン2018」(未出版)の作成に関わった。その作成プロセスにおいて、論文スクリーニング作業の負担が重いことから、機械学習の活用を思い付き、「第3のスクリーニング担当者」を生み出した。

 以下では、同氏の説明に基づき、これを紹介する。

●「心の折れる作業」をどう軽減できるか

 医療の世界では、「EBM(Evidence Based Medicine)」への取り組みが進められてきた。EBMとは、「医療行為は最新、最良の科学的根拠に基づいて行うべき」という考え方だ。診療ガイドラインは、EBM推進の観点から、臨床現場での意思決定における判断材料の1つとして利用することを目的とした文書で、各専門分野の学会などが委員会を組織して作成している。

 診療ガイドラインは、医療従事者の経験とそれに基づく判断を否定するものではないが、推奨も含む重要な文書。EBM推進という目的に照らしても、記載事項が正確・妥当であり、根拠が明確でなければならない。根拠が十分でない場合は、そのことを明記する必要がある。

 診療ガイドラインでは、多数の「クリニカルクエスチョン」と呼ばれるトピックのそれぞれにつき、1~3ページ程度の分量で解説が行われる。クリニカルクエスチョンの例として、「エビデンスに基づくCKD診療ガイドライン2013」には、「食塩摂取制限は小児CKDの腎機能障害の進行を抑制するため推奨されるか?」「生体腎ドナーの術後腎機能予後および生命予後を悪化させないためにはどのような CKD管理が推奨されるか?」などがある。

 各クリニカルクエスチョンの解説には、執筆者のバイアスあるいは独自の意見が入ってはならない。このため、解説は最新、最良の論文に基づくものでなければならない。解説作成プロセスの透明性を確保するため、各クリニカルクエスチョンの解説に続いてベースとした文献検索の内容、二次資料、参考文献が示される。

 こうした性質の文書であるため、ガイドラインの作成では「システマティックレビュー」という過程が重要だという。関連する文献を漏れなく調査し、質の高い研究データについて吟味・評価して、偏りを可能な限り排除し、まとめるプロセスだ。「この作業の負荷が、ガイドライン作成に参加する医師たちにとって非常に大きい」と神田氏は指摘する。

 システマティックレビューでは、まず適切な時期の論文を、医療論文データベース「PubMed」などで検索し、その結果を2段階でスクリーニングし、特定のクリニカルクエスチョンに関する記述の根拠とするのに適切な論文を選定する。「1次スクリーニング」では論文のアブストラクトの内容で選別を行い、「2次スクリーニング」では、論文の内容で分類し、さらに選別を進め、採用・不採用を判断する。

 漏れを防ぐため、当初の文献検索では幅広く結果を取得する。このため特に1次スクリーニングは、多数の論文のアブストラクトと格闘することになる。例えば今回神田氏が機械学習を適用した「患者教育は透析回避に効果があるか」というクリニカルクエスチョンでは、1012の論文が1次スクリーニングの対象になったという。2人の医師が、それぞれ別個に選定を行って、結果を持ち寄る形だが、「心の折れる作業」(神田氏)だという。

●共通一次試験対策裏ワザ本のヒントとは

 そこで神田氏は、話題になることの増えてきた機械学習/ディープラーニングに着目。テキストマイニングで文献のレコメンデーションができないかと考えた。疫学も専門であり、統計学に親しみのある神田氏は、自ら機械学習の活用に取り組むことにした。

 では、どういう戦略で進めるべきか。そこで神田氏が思い出したのは、大学入試共通一次試験対策の裏ワザ本の内容。国語で回答の選択肢として文章が示される問題の場合、「多くの選択肢に共通するフレーズを最も多く含んだ選択肢が正解」である可能性が高いとされていた。

 神田氏は、これを論文の1次スクリーニングに応用。人間が選択する論文(のアブストラクト)の多くに頻出する言葉を含む論文を抽出することで、選ぶべき論文のレコメンデーションができると考えた。つまり、人間が選択する論文のアブストラクトの内容を訓練データとして、ディープラーニングを実行することになる。

 神田氏は機械学習フレームワークにWindows版のTensorFlowを利用し、100の訓練データに基づいて作成した機械学習モデルを、972の論文アブストラクトに適用した。

 神田氏は各種のニューラルネットワークモデルを比較。CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)の幾つかのバリエーションに比べ、RNN(Recurrent Neural Network:再帰型ニューラルネットワーク)や、その派生形LTSM(Long Short-Term Memory)のバリエーションであるGRU(Gated Recurrent Unit)を使うことで、より高い精度が得られることを見いだした。

 今回の検証では、クリニカルクエスチョンとして、前出の「患者教育は透析回避に効果があるか」を使用した。機械学習によるレコメンデーションを「第3の査読者」として採用することで、人によるスクリーニングでは18の論文に絞り込まれていたが、新たに妥当と思われる論文を10件追加できたという。

 このクリニカルクエスチョンは、例えば「ビタミンD製剤はCKDに推奨されるか?」に比べると抽象的であるため、人による論文スクリーニングは手間がかかる。こうした場合に、上記の裏ワザ本をヒントにした機械学習/ディープラーニングは有用性が特に高いと、神田氏は話している。また、人による選択との比較で学習を積み重ねることにより、今後の改訂版に向けてさらに精度を高められるメリットがあるという。

●今後は「利用を働きかけていきたい」

 診療ガイドラインは、多数のクリニカルクエスチョンについての解説が収録されている。例えば公表されている前出の「エビデンスに基づくCKD診療ガイドライン2013」には、129のクリニカルクエスチョンがある。

 今回の検証は、そのうち1つに機械学習/ディープラーニングを適用して、効果を実証したにとどまる。神田氏は、今後他の委員に利用を働きかけていきたいと話した。また、2次スクリーニングへの応用を図っていきたいという。

最終更新:2017/12/22(金) 8:15
@IT