AIによる論文検索サポートツールが登場
研究者にとって、論文執筆に取り組む時間は重要です。世界中には多くの研究者が存在し新しい論文が次々に発表されています。さまざまな研究を行い、論文を執筆するに至るまでには、たくさんの重要なプロセスがありますが、必ず必要となるのが、文献検索ではないでしょうか。重要なプロセスですからじっくり十分な時間を割くことができればいいのかもしれませんが、そこに時間をかけ過ぎると研究や執筆の時間が減ってしまいます。限られた時間を効率よく使い、スムーズに次のステップに進められる文献検索について考えてみましょう。
論文検索ツールの進化
論文執筆に対する文献検索は、研究者の主張の根拠となるものを示すことが必要とされるため、膨大な資料や文献に目を通すことになります。必要な文献を効率的に探し出し、それを整理、管理することが必要不可欠です。近年のデジタルアクセスによって、文献にたどり着くまでにはさほど時間がかからなくなっていますが、一方でそのアクセスの良さから母数となる論文は加速度的に増えていくので、どう探すのか、というところがキーになっています。
そこで近年注目されているのが、AI型の論文検索ツールです。AIとは言うまでもなく人工知能のことですが、そのプロセスの低コスト化や高速化によって一般にも利用が進んできました。今度はそれを学術情報へ応用しようということで、従来の検索エンジンに比べてより効率的な論文検索が可能になってきました。AIの特徴である機械学習や自然言語処理によって、これまで難しかった「フォーマットが異なるデータ」についての情報収集が可能になりました。また、オープンアクセスが可能なメタデータやDOIなどの識別子の普及も相まってますます高度化し、学術情報流通の多くのプロセスにおいて、自動化はいっそう進んでいくことになると考えられています。
AI型ツールはいくつも存在していますが、今回はその中から3つのAI型論文検索ツールを紹介します。
Semantic Scholar
Semantic Scholarは、アメリカのアレン人工知能研究所(Allen Institute for Artificial Intelligence:AI2)によって2015年に提供が始まった、無料の学術論文データベースです。当初はコンピュータサイエンス分野に限られた300万件の論文から始まりましたが、その後神経科学分野、生物医学分野などへと分野の拡大を進め、2019年には全ての科学分野がカバーされました。現在ではMicrosoft Academicなどとの提携によって、1億8千万本以上の論文に対し、タイムリーでオープンな検索が可能になりました。なお検索可能な論文はSpringer Nature やPubMed、IEEE、Science、 bioRxivなど、全世界500以上の出版社、学会、大学出版局のライセンスデータ、データベース等となっており、キーワードの自動解析からTopicの分類、論文の引用付け、引用情報の意味解析が行われます。これらによって論文の構成のどの部分からの引用か(Background、Method、Results)を表示することが可能になっています。また、アブストラクトや図表の自動抽出も可能です。さらにこうした機能に加え、2020年11月にはTLDR(Too Long;Didn’t Read)機能ベータ版の利用が始まっています。これは論文内容の一文要約を自動生成するサービスです。このサービスによって、論文検索の結果画面に要約が表示され、迅速に適切な論文を見つけることが可能になっています。この機能についてAI2は、近年のモバイル端末経由でSemantic Scholar利用が大幅に増えていることも背景にあるとしています。
Meta
Metaは、Chan Zuckerberg Initiativeが提供する生命医学分野の論文を文脈から検索するサービスです。もともとは別会社による運営で存在していたツールでしたが、2017年にChan Zuckerberg Initiativeが買収し製品強化をはかったのち、利用を無料化し現在に至ります。 Metaは、関心領域の専門用語を登録することでフィードを自動生成します。これにより利用者独自のタイムラインとして、登録した領域について継続的に確認することができます。フィードでは重要論文の新着情報確認やお気に入り登録ができ、簡単に情報管理が行えます。さらに、世界中の研究者や同僚とのダイレクトにやりとりできるメッセージ機能が備わっているため、重要論文等を共有することができ、メッセージを受け取った側のライブラリーに追加される仕組みになっています。なお、現在対象となるジャーナルは3万9000以上、プレプリントは5万5000以上となっており、毎日4000以上の論文が追加されています。
Amanogawa
Amanogawaは、2020年7月に株式会社FRONTEOがリリースした、独自のAIエンジンを搭載した論文検索システムです。調べたい単語や仮説との明確な一致だけでなく、入力語に含まれる概念まで検索する”ベクトル検索”が可能となっています。そのため、入力語が含まれているかを検索するキーワード検索では探しきれなかった、キーワードは含まれていないが関連する論文を瞬時に見つけ出すことができるとしています。入力された文言から、PubMedの掲載論文情報を抽出・分析し、その結果を位置情報として表示されるマップでは、検索者のバイアスがかかることなく、論文のアブストラクトに基づいてグループ分けされた論文が視覚的に全体像として把握することができます。論文相互の関連性を一目で確認することができ、表示された結果からの並び替えや一覧表示もできるため、効率よく有効な結果を得ることができます。
参考文献
情報の科学と技術 69 巻 11 号,529~534(2019) 新世代の学術文献データベースが切り拓く可能性 宮入 暢子
Semantic Scholar
Semantic Scholar TLDR
カレントアウェアネス・ポータル 米・アレン人工知能研究所(AI2)の学術文献検索サービス“Semantic Scholar”、論文の内容を人工知能で自動的に一文に要約して表示するTLDR機能のベータ版提供を開始
Chan Zuckerberg Initiative Jan 23, 2017 CZI to Boost Scientific Research with AI-powered Meta
科学技術振興機構
科学技術情報プラットフォーム 2017年07月25日 人工知能を搭載した無料の論文検索エンジン、Meta Science(記事紹介)
meta
FRONTEO ライフサイエンスAI 論文探索AI「Amanogawa」