Вес нецитируемых статей в научной коммуникации
Цитирование — это условная валюта, которой обмениваются авторы статей в ходе академической коммуникации. Какой вклад в процессы обмена и распространения знания вносят нецитируемые статьи, проанализировали специалисты из Института статистических исследований и экономики знаний НИУ ВШЭ и Американской ассоциации содействия развитию науки, изучив более 700 тыс. научных статей по физике высоких энергий из базы данных INSPIRE-HEP. Исследование опубликовано в Journal of Informetrics. Работа поддержана грантом Минобрнауки России.
Научную коммуникацию можно интерпретировать как процесс производства и потребления цитирований. Количество ссылок, которые даются в статье, или полученных ею цитирований, — это косвенный показатель производства или потребления научного признания. Статьи, которые чаще ссылаются на другие работы (экспортируют), чем цитируются сами (импортируют), — производители научного внимания. Потребители — статьи, которые больше цитируются другими, нежели цитируют сами. Нецитируемые статьи выступают чистыми экспортерами. Таким образом, распределяя своё внимание между цитируемыми статьями, они участвуют в формировании научной коммуникации.
Чтобы определить статистические связи между импортирующими и экспортирующими статьями, исследователи из ИСИЭЗ НИУ ВШЭ и Американской ассоциации содействия развитию науки провели анализ почти 730 000 научных публикаций из базы данных INSPIRE-HEP. Учёные выбрали статьи по физике высоких энергий, опубликованные с 1970 по 2015 год. А затем, опираясь на полученные публикациями цитирования, разделили их на девять групп (квантилей). Наиболее цитируемые вошли в первый квантиль (Q1), работы с нулевым цитированием — в девятый (Q9). То же самое деление учёные проделали, исходя из количества ссылок на другие статьи внутри исследованных публикаций.
Авторы отмечают, что уровень цитируемости статей связан с уровнем цитируемости научных публикаций, на которые они ссылаются. Наибольшее количество цитирований (70,4%) статей из первого квантиля приходится на статьи также из первого квантиля, 16,2% цитирований первого квантиля — на статьи второго квантиля и так далее.
При переходе от Q1 к Q9 соотношение между ссылками и цитированием меняется. Так, статьи из Q1 набирают максимум цитирований (57,1%) и дают максимум ссылок (25,4%), публикации из Q2 генерируют одинаковое количество ссылок и цитирований (18,1%). Затем баланс смещается, например, статьи из Q4 производят 11,5% ссылок, привлекая лишь 6,5% цитирований, и далее по убывающей. Иначе дело обстоит с нецитируемыми статьями из Q9.
Нецитируемые статьи из Q9 производят 6,8% ссылок, что соответствует генерации ссылок статьями из Q5. То есть их вклад оказался непропорционально большим относительно ранга квантиля Q9. Любопытно, что после того, как мы убрали цитаты из нецитируемых статей, более 20 тысяч научных публикаций перешли в категорию нецитируемых.
Авторы исследования также проанализировали динамику цитирования. Оказалось, что со временем рост числа ссылок обгоняет рост числа публикаций, а это приводит к снижению доли нецитируемых статей. Кроме того, учёные предложили модель прогнозирования таких публикаций.
В наукометрии нецитируемые статьи традиционно выступают неудобным объектом. Существует проблема инфляции нуля: известные библиометрические модели не в состоянии точно предсказать долю нецитируемых статей в выборке. С помощью нашей модели мы смогли более точно, нежели коллеги, оценить вероятность нулевого цитирования.
Юрий Качанов
Один из авторов исследования, главный научный сотрудник ИСИЭЗ НИУ ВШЭ
Опубликовано на IQ.HSE под заголовком «Нецитируемые статьи оказались "Робин Гудами" научной коммуникации»
Наталья Шматко
Один из авторов исследования, заведующая отделом исследований человеческого капитала ИСИЭЗ НИУ ВШЭ