医学書院

検索
HOME週刊医学界新聞 > 第3328号 2019年07月01日



第3328号 2019年7月1日


図書館情報学の窓から

「図書館情報学」というあまり聞き慣れない学問。実は,情報流通の観点から医学の発展に寄与したり,医学が直面する問題の解決に取り組んだりしています。医学情報の流通や研究評価などの最新のトピックを,図書館情報学の窓からのぞいてみましょう。

[第2回]来るべき,AIが学術論文を書く未来のために

佐藤 翔(同志社大学免許資格課程センター准教授)


前回よりつづく

 皆さんは論文の「Introduction(はじめに)」を書くのはお好きでしょうか。私は大嫌いです。「なんかこのネタ面白そう……(少し先行研究を調べ)……お,あまりやられていない。やろう!」と,ほぼ思いつきで研究を始めることが多く,その思いつきにもっともらしい研究意義を付け加えるのに毎回,難儀します。意義を説明するために改めて文献を探したりまとめたりするわけですが,研究最初期に類似研究がないかを探すのとはまた違い,論文を書くために行う文献レビューは正直,億劫です。それを億劫と思う人が多い,つまり「増え続ける論文を処理するのも,探すのも,読むのも大変だ」,という人が多いので,それをなんとかするために,図書館情報学という分野が誕生した……という話は前回(第3324号)述べました。

 先人たちの頑張りのおかげで,論文を探して入手するまではすっかり楽になったのですが,いまだに,入手後には読まなければいけないわけです。なんてこった。しかしそれも,もう少しの辛抱です。ついに,自分で文献を読んでまとめなくても,AIが全てやってくれるようになる,かもしれません。

 AI活用について医学,あるいは医療実践は現在,最先端をいっています。2018年に日医が発表した報告書には活用例が多数掲載されており,診断・診療,あるいは創薬にもAIが活用できると紹介されています1)。これらの領域で主に用いられるのはディープラーニングの技術であり,特に画像処理領域の進歩が昨今のAI活用には大きく効いています。

 他方,文書をコンピュータで処理する,いわゆる自然言語処理も,長くAI関連で研究されてきたテーマです。その研究から現在のような情報検索の仕組みが確立し,「探す」作業を人間はかなりの部分,機械に任せられるようになりました。そして自然言語処理領域では「探す」部分だけではなく,「読む」部分についても機械に任せたい……具体的には集めた文献を自動的に整理・要約する技術が研究されました。その成果の結実が,2019年4月にSpringer Nature社が発表した,同社初,そしておそらく世界でも例のない,全てを機械が執筆した学術書『Lithium-Ion Batteries』2)です。

 簡単に同書の概要を紹介します。この本はSpringer Nature社と独ゲーテ大の研究者らが共同で開発した執筆ツール「Beta Writer」によって(まえがきを除く)全てが書かれています。中身はタイトルの通り,スマートフォンにも用いられるリチウムイオン電池に関する研究動向をまとめた大部の文献レビューです。重要性が増している技術だけに関連研究も盛んで,過去3年における関連研究の出版点数は5万3000本以上,まさに読み切れないほどであることから,この分野がBeta Writerの最初のターゲットとして選ばれました。

 Beta Writerの基本的な機能は文献の整理と自動要約です。なんらかの文献群を投入すると(今はどんな文献群を投入するかは人間が選ぶ必要があります),各文献の主な発見内容とキーワードが抽出されます。さらにキーワードに基づいて文献間の類似度が算出され,似た文献をまとめるクラスタリングが行われます。クラスタリング結果に基づいて章・節立てが行われ,さらに各節に該当する論文が分類・要約され,本文が生成されます。その際,文章表現に配慮して適宜,語の置き換えも行われます。加えて,各章の冒頭にIntroductionの節が設けられ,複数文献のIntroductionを横断して要約した結果がここでまとめられます。そう,Introductionも,人が書かなくて良いわけです!

 開発者も同書「まえがき」(これだけは人が書いています)で述べていますが,技術自体はいわゆる“枯れた”状態にあるものが主です。いかにもAIらしいディープラーニングの技術は用いられていません。逆にいえばそれでもある程度,実用に堪える文献レビューやIntroductionはすでに生成可能,ということで,Introduction執筆が嫌いな私のような人間にとっては,今後の見通しはさらに明るいと言えそうです。

 今回は旧Springer社の強みである工学分野で実験が行われましたが,当然,医学分野への応用もすぐでしょう。というか,完全AI執筆ではなくとも,AIが文献レビューを含む「はじめに」の草稿を作成してくれるサービスはすでに存在します。SciNoteという電子研究ノートサービスのオプションです3)。研究ノートに入っているデータに基づいてMaterials and MethodsやResultsの章を生成してくれることに加え,関連キーワードから自動で文献を検索し,本文が入手できる(いわゆるオープンアクセス)状態にある論文に基づいて,Introductionの草稿まで書いてくれるといいます。ただ,提供会社としては作るのはあくまで「草稿」で,人間のチェックなしで出版できるものとは考えていない,とのことです。そのままだと文章として難があるのはもちろん,他の文献から自動で中身を作ったものなので,ただのコピペ=剽窃かつ著作権侵害になる場合もある,と指摘されています4)

 Beta Writerではどうなのかといえば,言葉の置き換えを一部行うことと,自社の出版物だけを用いることで,著作権侵害の問題を回避したのでしょう。逆に言えば,『Lithium-Ion Batteries』には他社論文のレビューがないという致命的な問題があるわけです。日医の報告書にも,AIのさまざまな可能性実現には膨大な,あるいは良質なデータが必要であると強調されており,この点は論文AIでも同様です。

 現状,論文データへの自由なアクセスは,主として商業出版の仕組みと著作権制度によって阻まれています。このうち権利の点については,米国は著作権制度にフェアユース規定があることでクリアでき,この規定がない欧州でも制度の見直しが図られています。

 ただ,有料雑誌にアクセスできないことには話になりません。オープンサイエンス推進に向けた近年の国際的な動向の背景の一つはここにあります。論文(=テキストデータも含む,科学データ)への広範なアクセス実現が,さまざまなブレークスルーへの鍵として注目されているわけです。オープンアクセス,オープンサイエンスの動向はぜひ今後,本連載でも紹介したいと思います。

 さて仮に論文データへの自由なアクセスが可能になったら,AIによる論文執筆はどう進むのでしょうか。まずレビュー論文については,今回紹介したように完全機械化も可能になります。研究論文の場合は,リサーチ・クエスチョンを立てる(あるいは選択する)ことと,それを受けた考察・結論作成へのアプローチはそれほど進んではいません。逆に,そこさえ人間がやるのであれば,つまり機械との共著論文であればそう遠くなく,実現するでしょう。「人間の共著者以上の貢献を機械がした」と判断できる場合を機械との共著とするなら,SciNoteはすでに共著者といっていいレベルかもしれも知れません。

 『Lithium-Ion Batteries』のまえがきでは,そうした環境下において「著者(author)」とは一体なんなのか,と問い掛けています。今回,Springer Nature社は同書の著者としてBeta Writerとソフトウェア名を掲載しましたが,ここに開発者名が載っていてもいい気はします。

 では,Beta Writerを入手した第三者が,自分で選んだ文献を投入して論文を生成した場合はどうでしょう? それを「自分の論文」として発表するのはなにかおかしい気がします。Beta Writerが一般公開されれば,そうしたケースはおそらく多数出てくるものと思われます。科学者はこの問いにどう向き合うべきでしょうか?

 ……とまあ,つい暗い話になりますが,基本的には本件は明るい未来につながる話である,と自分は考えます。なにせ,Introductionを書かなくてよくなるかもって話なんですから!

“Artificial Intelligence & AI & Machine Learning” ©Mike MacKenzie(Licensed under CC BY 2.0)
Image via www.vpnsrus.com

つづく

参考文献・URL
1)日医学術推進会議.第IX次学術推進会議報告書 人工知能(AI)と医療.日本医師会学術推進会議.2018.
2)Beta Writer. Lithium-Ion Batteries――A Machine-Generated Summary of Current Research. Springer Nature. 2019.
3)SciNote.Manuscript Writer by SciNote.
4)McCook A. Newly released AI software writes papers for you―what could go wrong?. Retraction Watch. 2017.

連載一覧