研究の質と量をバランスよく評価するh-index
h-index(h指標またはh指数ともいう)は、研究者が報告してきた論文の質と量の両方をバランスよく評価できるとして、近年使われることが増えてきた指標です。h-indexの計算方法と長所、短所を紹介します。
h-indexの定義と計算方法
h-indexは、2005年に物理学者のJorge E. Hirsch氏が『PNAS』誌にて考案した指標です。その定義は、「被引用数がh回以上ある論文がh本以上ある」となります。
具体的な算出方法は、まず論文を被引用数が多い順に並べ、定義を満たすhの最大値を求めます。
例えば、ある研究者の論文を被引用数順に並べたとき、被引用数が
50、15、10、9、8、4、3、2、2、1、1、1
だったとします。このとき、h=5では条件を満たし、h=6では6位の「4回」が条件を満たさないため、h-indexは5となります。つまり、「被引用数が5回以上ある論文が5本以上ある」という意味になります。
実際には、データベースを用いれば自動で計算できます。例えばScopusやWeb of Scienceで自分の名前を検索すれば、簡単にh-indexを確認できます。無料のGoogle Scholarでは、英語版にアクセスして研究者名を検索すればh-indexを表示できます。ただしこの場合、それぞれのデータベースに登録されているジャーナルの種類に依存するため、数値に若干の差異が生じる場合があります。
h-indexの長所と短所
h-indexの長所は、計算のしやすさです。全ての論文の被引用数を把握する必要がなく、被引用数の多い上位の論文とその被引用数さえ把握できれば簡単に計算できます。また、今回は研究者個人を例にしましたが、同じ計算方法で研究機関やジャーナルも評価できます。
一方で、h-indexにも短所はあります。例えば、別の研究者の論文を被引用数順に並べたとき、被引用数が
500、150、100、90、80、4、3、2、2、1、1、1
だったとしてもh-indexは5となりますが、最初の例で出した研究者と同等の実力をもっているとは評価できません。このように、被引用数の絶対値の情報が抜け落ちてしまうという欠点があります。
また、研究期間が長いほど被引用数や論文数は増えるため、h-indexの数値も増える傾向にあります。そのため、研究期間が異なる研究者や、創刊年が異なるジャーナルを単純に比較するのは困難です。この短所を克服するために、対象を直近5年間に限定するh5-indexという指標も登場しています。
h-indexの定義だけでなく長所と短所を知ることで、研究者やジャーナルを適切に評価できるようになるでしょう。