The State of Open Data 2023の概要
The State of Open Dataは、オープンデータに対する研究者の態度や経験を縦断的に分析した年次報告書であり、Springer NatureとFigshareがまとめています。2023年11月には、第8回目の報告となる「The State of Open Data 2023」が公開されました。今年のデータ調査では合計7,042件の回答があり、利用可能な回答は6,091件でした。
5つのKey takeaways
冒頭では「Key takeaways」として、本報告書における要点が5つ列挙されています。
1)回答者の約4分の3が、オープンデータの作成にあたって支援を受けたことはないと回答した
2)専門知識や研究者が属する地域によって回答にはバラつきがあり、研究データをグローバルに管理するためには、国や地域、分野の際を考慮した繊細なアプローチが求められる
3)研究者のキャリアの長さは、オープンデータの認知度や支持率において重要な要素ではない
4)8年間にわたる調査で、研究者たちは信用性についてずっと懸念していることがわかった
5)今回の調査で初めて、データ収集やデータ処理、メタデータ作成などにAIツールを使用しているかという調査が行われた
オープンデータ化に対する支援の重要性
Key takeawaysの1つ目に挙げられていますが、オープンデータ化に際して支援を得られたと回答したのは23%にとどまっています。オープンデータの作成に対する支援の不足については、政策やオープンデータ化の義務付けが世界的にも拡大するなかで、研究者が適切なサポートを受けられていないという課題が浮き彫りとなりました。
支援者の内訳をみると、同僚や上司などの内部の情報源が最も多く61%となっており、研究コミュニティ内での情報交換が多いことがうかがえます。次いで、機関図書館が31%、研究室・研究機関が26%となっています。持続可能なオープンサイエンスを実現するためにも、研究コミュニティの連携や情報提供がより重要になると考えられます。
なお、オープンデータの作成に関して特に支援を必要とする分野としては、「データの著作権/ライセンス」に対する支援を求める研究者が最も多く、回答者の63%を占めていました。また、2023年の調査では、「データを管理する時間の確保」に対する支援と「データ管理ポリシー」に対する支援を求める回答も大きく伸びました。
ライセンス関係やデータ管理にかかる時間の軽減など、研究者のニーズにあわせた支援が拡充すれば、オープンデータ化がよりいっそう進むと予測されます。
研究活動におけるAIの活用について
DMP(データマネジメントプラン)とは、研究のために収集・作成するデータの整備、保存、公開について管理方法をまとめた計画のことです。研究の助成機関が、投資した研究成果の公開や再利用、あるいはデータの効率的かつ適切な管理などの目的で、DMPの提出を要求することがあります。
ところが、今回の調査では回答者の約半数がDMPという概念を知らないと回答していました。また、回答者のうち43%は研究資金を得ている機関の要請に応じてDMPを作成したといいます。
DMPを作成するうえでの課題としては、データマネジメントの訓練を受けたスペシャリストがいないことや、データの保管場所・整理方法などの技術的な課題などが挙げられています。
オープンデータの発展を長期的に記録した有用な資料
今年で第8回目の報告となるThe State of Open Dataは、オープンデータの確立や研究者によるデータ共有の体験を時系列でまとめた有用な資料といえます。この取り組みは広がっており、2023年11月末にはSpringer Natureと中国科学院コンピュータ・ネットワーク情報センターが共同でまとめたパートナー・レポート「中国オープンデータ白書2023」も発表されました。オープンデータが今後どのように発展していくのか、次年度のThe State of Open Dataにも注目しましょう。
参考文献
Springer Nature — The State of Open Data 2023
Springer Nature — 【プレスリリース】 The State of Open Data 2023報告書:研究者への支援はいまだ不十分
データマネジメントプラン(DMP)― FAIR原則の実現に向けた新たな展開
Curren Awareness Portal — 中国科学院とSpringer Nature社ら、共同で「中国オープンデータ白書2023」を公開:研究者の78%が研究データ公開の慣例化を支持