«Научный поиск — это не спринт, а марафон»

Фото: Атомный эксперт, Unsplash.com

Заведующий лабораторией академических компетенций и управления знаниями ТюмГУ, заместитель директора библиотеки ТюмГУ Константин Кокарев рассказывает о том, как эволюционировали функции научных публикаций, дает полезные советы по быстрому поиску и отбору необходимой информации, а также делится лайфхаками по организации персональной научной библиотеки.

Научная публикация в том виде, в котором мы ее знаем, появилась тогда же, когда образовались научные общества и научные журналы в Лондоне и Париже. Тогда же, в XVII веке, появилась эмпирическая наука. Большинство публикаций в первых научных журналах отсканированы и доступны, например, на http://www.jstor.org/.

Правда, эти статьи не похожи на те научные статьи, к которым мы привыкли. Они предназначались для очень ограниченного круга лиц, ведь тогда наукой занималось значительно меньшее, чем сегодня, количество людей. Сейчас такие публикации, конечно, ни один серьезный научный журнал не ­принял бы.

Но если рассматривать понятие научной публикации шире — как способ коммуникации ученых, — то всё будет сложнее. Ведь книга, например, тоже способ научной коммуникации. Но книги стали писать гораздо раньше XVII века: эмпирические тексты Аристотеля вполне можно считать научными публикациями, так как они способствовали зарождению массы дисциплин. Подобные книги появлялись и в древней Индии, и в Китае.

Любая научная публикация выполняет несколько функций. (Мне кажется, что основные функции научных публикаций не ­изменились.)

Первая — это фиксация авторства, причем интересно понаблюдать, как с развитием информационной составляющей эта функция эволюционирует. В самых первых журналах было достаточно просто указать свои имя и фамилию. Теперь, с ростом населения и числа ученых, идентификация автора усложняется, стала необходима аффилиация. То есть в классификации авторских ролей нужно написать, чтó именно вы сделали для этой работы: изготовили необходимые для эксперимента детали или написали заявку на грант. Сейчас серьезные исследования чаще всего глобальные, в них принимает участие огромное количество людей, и роль аффилиаций растет.

Вторая функция — это фиксация содержательной части. В каждой научной публикации есть этот элемент. Каждое высказывание нужно подтверждать ссылками на источники, статистическими данными и так далее.

Третья и, наверное, самая важная функция — коммуникативная. Зафиксировав свое авторство и свою идею, вы стремитесь также к тому, чтобы ваша идея была переплетена с другими идеями в научном сообществе. Эта функция тоже эволюционировала: если раньше, еще в начале ХХ века, по своей теме ученому нужно было прочитать максимум пять журналов (и дать на них ссылки) — больше научных изданий в мире просто не существовало, — то теперь ему необходимо изучить огромные объемы информации. И если сегодня ученый сошлется на пять работ, то это будет выглядеть странно. Очень важно, чтобы его идея была вплетена в глобальную «паутину смыслов». Именно поэтому так высоки требования к списку литературы: к его величине, к обзорности материалов. Если вы проанализировали множество источников, используя все возможные инструменты, то сможете написать достойную статью.

Это как в работе хирурга: предполагается, что если вы приступаете к операции, то у вас вымыты руки и простерилизованы инструменты. Иначе пациент может умереть. А если ученый должным образом не обработал всю необходимую информацию, то это может иметь серьезные последствия: например, финансовые потери для инвесторов и крах карьеры самого ученого.

Повторю: глобально основные функции научной публикации не поменялись. Но они сильно эволюционировали, потому что сегодня наука существует в других социокультурных конфигурациях и требования к ученым стали выше, чем раньше.

Проблема в том, что наука — это сложно предсказуемая деятельность, и приходится придумывать «костыли», чтобы хоть как-то ее прогнозировать. Нужен содержательный диалог между учеными, администраторами, грантовыми фондами и всеми остальными, и такой диалог ведется. За последние 10−15 лет позиция наукометристов сильно эволюционировала. Например, Институт научной информации (Institute for Scientific Information, США) провозгласил, что качество важнее количества, и обращать внимание только на формальные показатели — на цифры — больше невозможно.

Гонка за формальными показателями действительно может негативно сказываться на исследовательском процессе. Конечно, ученому сложно ответить на вопрос, сколько прорывных исследований он сможет выполнить за ближайшие пять лет. Выполнить исследование — это не картошку посадить. Тут велика доля случайности. И если к ученому предъявляются определенные требования в плане количества публикаций — допустим, не меньше 15 в год, — то он «нарежет» одно свое исследование на 15 кусочков и выдаст 15 требуемых статей.

Так что его коллегам для того, чтобы ознакомиться с темой, придется прочесть не одну работу, а 15. То, что раньше можно было прочитать в 10 статьях, теперь в 150 нужно искать! В итоге ученые больше времени тратят на работу с источниками и меньше — на свои исследования. Совокупное вложение времени, сил и всего остального увеличивается, а результаты падают. В этой ситуации единственный разумный шаг — проигрывать в метриках, но выигрывать в содержательной части. К тому же эти 15 «нарезанных» публикаций процитируют с меньшей вероятностью, чем одну содержательную.

Однако те, кто утверждает, что метрики стимулируют ученых только к публикациям, а не к исследованиям, сами себе противоречат: разве возможны публикации без исследований? Даже обзорная статья — это уже исследование, так как она ставит новые вопросы и по-новому оценивает существующую теоретическую литературу. Поэтому мой совет всем, кто хочет развивать свои научные коллективы и иметь нормальное грантовое финансирование: нужно вписывать в «короткие» метрики долгие циклы исследования.

Я полагаю, что в ближайшее десятилетие мы уйдем от оценок научных исследований, основанных на метриках, так как они дают только краткосрочные результаты. Глобальные социотехнические изменения происходят благодаря долгосрочным исследованиям. Интернет появился не в результате одного гранта, а потому, что в течение нескольких десятилетий финансировались фундаментальные проекты. Конечно, гранты никуда не уйдут, но есть и другие формы поддержки науки.
Биография эксперта
Константин Павлович Кокарев родился в 1984 году в Тюмени. После окончания Тюменского государственного университета учился в аспирантуре Института научной информации по общественным наукам, где потом работал исследователем, а также редактором научного журнала и книг.

Больше 10 лет преподавал (курсы по информационной грамотности, академическому чтению и письму) в различных вузах Москвы и Тюмени: МГУ им. М. В. Ломоносова, ВАВТе, РАНХиГСе и МВШСЭНе, Тюменском государственном университете.

Области научных интересов: аналитическое чтение, поисковая эвристика, академическая этика, аргументированное письмо, информатизация науки и образования, методология социальных наук, качественные методы в политической науке.
Какой должна быть хорошая публикация
С точки зрения потребителя, хорошая научная публикация — та, которая помогает ему решить его задачу. На каждом этапе исследовательского процесса предполагается отдельный ответ на этот вопрос. Например, если задача ученого — опубликовать определенное количество статей в узкоспециализированном журнале, то, возможно, хорошей публикацией для него будет работа, содержащая обзоры того, чтó происходит конкретно в этой области. Но если брать серьезный исследовательский цикл, то здесь есть много конкретных механизмов определения качества публикаций. Например, на этапе выявления исследовательской проблемы полезной для исследователя работой будет обзор, написанный именитым автором и опубликованный в авторитетном журнале.

Если вам нужны публикации, связанные с методическими вопросами, то найти их будет сложнее — привычные механизмы поиска могут не сработать. Например, новые технологии проведения исследований могут апробироваться довольно долгое время, а пока они не апробированы до конца, они не попадут в авторитетные журналы. Поэтому посвященные им материалы можно найти в профессиональных рассылках или на узкоспециализированных конференциях. Кстати, многие базы научного цитирования сейчас включают не только журналы, но и конференции, и даже патенты.

Если хорошая публикация для вас — та, которая содержит не интерпретацию, а полезную информацию, применяйте поиск по дата-сетам. Это огромное быстрорастущее поле, имеющее большой коммерческий и научный потенциал. Правда, с более чем полувековой историей, потому что первые серьезные компьютерные базы с полезными данными стали появляться уже в 1960-х годах: например, по кристаллографии или сравнительной политологии. Кстати, эффективная работа с публикациями — это, в числе прочего, понимание принципов работы с дата-сетами, знание поисковых инструментов.

В общем, для каждого этапа исследовательского цикла есть свой ответ на вопрос, какую публикацию можно назвать хорошей. Но очевидно, что универсальным будет ответ: хорошая публикация — это та публикация, которая помогает читателю-­ученому провести исследование быстрее, экономнее, убедительнее или просто справиться с какими-то проблемами. Думаю, при ответе на этот вопрос важно сохранить содержательное, «человеческое» отношение, а не сводить все к формальным требованиям (публикации не старше пяти лет, в журнале не ниже второго квартиля, автор с индексом Хирша не ниже определенного уровня). Потому что иначе весь исследовательский процесс можно будет поручить машинам, но смысл науки тогда пропадет.

Часто спрашивают, где искать хорошие публикации и как не потеряться в море информации. На этот вопрос у меня есть ответ, который мало кого удовлетворяет. Нужно искать постоянно, и тогда через какое-то время вы перестанете теряться. Поиск — это не разовая, а регулярная деятельность. Если на каждом этапе исследования вы будете систематически выполнять поиск, то к концу исследования, скорее всего, уже будете знать, условно, пять основных изданий, 20 авторов и 30 ключевых текстов по вашей теме. Почему? Да потому, что вы будете постоянно на них натыкаться. А опасность потеряться возникает, когда вы только-­только вошли в новую тематику и плохо в ней ориентируетесь. Такая ситуация характерна прежде всего для молодых ученых.

Своим студентам, задающим мне вопрос: «Как не потеряться?» — я обычно предлагаю формальные решения. Составить список из не менее чем 10 журналов, 10 авторов, пяти книг, пяти ведущих конференций. По всем этим источникам посмотреть локации, проверить коллег этих авторов, посмотреть, в каких изданиях они выступают редакторами, и так далее. Все это несложно найти по современным базам. Но это очень абстрактная история, и содержательной она может стать, только превратившись в цикл: вы ищете, находите, проверяете, перепроверяете, ищете снова …

Поиск — это трудоемкий, но очень значимый элемент исследования. На мой взгляд, к поиску надо относиться не как к спринту, а как к марафону. Например, вы решаете для себя, что в течение полугода будете два раза в неделю тратить час на поиск, проверку по базам. За эти полгода ваш уровень понимания научной проблемы возрастет, изменится сам запрос, и в то же время сформируется круг полезных публикаций. В этом случае поиск становится менее трудозатратным процессом, вы осваиваете эффективные техники поиска.

В чем главная проблема поиска? Вы сможете найти что-то достойное, только зная, чтó хотите найти. А если вы еще на этапе «найди то — не знаю что», то, даже если вам попадется полезная публикация, вы этого не поймете.

Какие научные базы нужно использовать обязательно? Из бесплатных — Google Scholar, Российский индекс научного цитирования (РИНЦ), Microsoft Academic Search, причем последние два ресурса, на мой взгляд, структурированы лучше, чем Google Scholar, хотя в нем чуть больше материалов и поиск там может выдать неожиданные результаты. Тем не менее на начальном этапе Microsoft Academic Search и РИНЦ полезнее, чем Google Scholar: там есть удобно структурированные профили авторов и организаций.

Из баз, доступных по подписке, — Web of Science, Scopus, Dimensions. Последняя в базовом виде открыта бесплатно, в платной версии добавляются патенты и поиск по документам (например, государственным), что крайне значимо для некоторых дисциплин. Кроме того, для каждой науки есть свои специфические ресурсы (для математиков, инженеров, программистов, например, — archive.org).

Что делать, если у вас или у вашей организации нет доступа к платным базам? Запланируйте посещение научной библиотеки в республиканском или областном центре, библиотеки при Академии наук, любой другой крупной библиотеки, имеющей хорошую подписку (в Москве это, например, Российская государственная библиотека). Подготовьтесь к визиту: перепроверьте по открытым базам всё, что вам нужно, посмотрите, что нового могут вам дать платные базы. Они зачастую хороши даже не тем, что в них больше информации, а тем, что выдают информацию в структурированной форме.

Безусловно, вся полученная информация нуждается в перепроверке, причем источники могут быть разными, например, сайты исследовательских лабораторий или научных обществ, где выкладываются грантовые заявки.

Еще один вопрос, который многие себе задают: на каком языке нужно писать и искать научные статьи — только ли на английском?

Конечно, язык мировой науки сегодня — английский. Если вы претендуете на глобальную аудиторию, если ваша публикация должна попасть в те издания, которые учитываются при выдаче грантов, то лучше всего писать на английском. Но это не значит, что не нужно писать на других языках. Вопрос в другом: есть ли в рамках какого-то языка то научное сообщество, с которым вы хотите общаться? Если, например, ваши основные читатели — китайцы, зачем вам писать на английском языке? Пишите по-китайски.

Что касается поиска, то вам как ученому стоит искать материалы на всех языках, на которых пишут на вашу тему. Однако есть проблема. Глобальные базы типа Web of Science или Scopus настроены на работу с латиницей, и поиск на других языках там сейчас выстроен примитивно или его просто нет. При этом РИНЦ умеет работать с разными алфавитами: и с русским, и с латиницей, и даже с армянским. Все базы будут двигаться в сторону большей многоязычности, потому что автоматический перевод очень быстро развивается: программы научились переводить некоторые типы текстов не хуже людей. Так что, возможно, в ближайшем будущем вопрос, на каком языке писать, отпадет сам собой.
Найти и не потерять
Что делать, если ты нашел 200 документов, и по формальным признакам все они нужные? Как быстро определить, будет ли та или иная статья для вас полезна? Если у вас нет времени на полный анализ данных и никаких иных эвристик (способов принятия решений), то можно просто выбрать работы, написанные именитыми авторами, или, например, самые цитируемые. Но это не всегда срабатывает: самой цитируемой может оказаться публикация 30-летней давности, для вас уже не актуальная.

Я предлагаю другой подход. Спросите себя: зачем я читаю сейчас эту статью? Может быть, вы хотите узнать, какой взгляд на проблему существовал 20 лет назад и как он эволюционировал? Тогда вам будет полезна солидная обзорная статья, охватывающая большую временную перспективу. А если, например, вы хотите понять, какие данные необходимы для того, чтобы ваше исследование соответствовало всем стандартам и было опубликовано в авторитетном журнале, то, очевидно, нужно брать топовые издания по близким к вашей тематикам и смотреть, как оформлены тексты там.

Сейчас большинство серьезных исследований выполняется группой ученых. Так вот, важно, чтобы внутри вашей группы существовало разделение труда, и каждый работал над решением конкретной задачи. Осознав, чтó именно вам нужно, вы бегло просматриваете текст, находите нужные места и начинаете с ними работать. Потом, когда у вас появится другой запрос, тот же текст вы можете «просканировать» по-другому и найти там другие ответы.

Это сложно объяснить, но, думаю, все, кто с этим сталкивался, хорошо понимают, в чем разница: просто читать текст или искать в нем информацию для конкретного исследования. Во втором случае у вас меняется оптика: вы видите, какую полезную для вашего исследования «детальку» можно вытащить из текста.

Так что азы наукометрии, безусловно, нужно знать, чтобы отсекать очевидно маргинальные тексты. Но ­все-таки важнее понимать, какую именно задачу вы решаете в данный момент. Мой опыт показывает, что магистры и аспиранты гораздо быстрее учатся находить информацию, чем понимать, какая именно информация им действительно необходима. Представьте, что вы никогда не водили машину. Сели за руль, нажали педаль газа, поехали — и врезались в стену. И говорите: эта машина никуда не годится! Но ведь проблема-то не в машине. Нормально водить — это не только уметь жать на газ. Нужны определенные навыки, опыт и понимание того, куда вы хотите приехать.

В поиске информации, как и в исследовательском процессе вообще, необходимо терпение. Никто еще не написал гениальную статью за день.

Еще одна важная для каждого исследователя тема — организация персональной библиотеки. Первое и самое важное правило здесь: нужно осознать, что вам необходимо систематически собирать собственную библиотеку. Чем дольше вы с ней работаете, тем больше бонусов получаете. Это похоже на банковский вклад: чем дольше деньги там пролежат, тем больший процент вы получите. Возможно, вначале вам покажется утомительным систематизировать все материалы. Но потом опыт накопится, и вы будете делать это автоматически. В итоге эта система начнет работать. Персональный рабочий архив с годами экономит все больше вашего времени, потому что вы практически перестаете тратить его на поиск информации.

Кроме того, часть информации может исчезнуть из Интернета безвозвратно: например, правительственные отчеты, исследования НКО и так далее — сайты закрываются, и доступ к информации пропадает.

Универсальных правил хранения информации не существует — у всех свои потребности. Однако есть несколько базовых принципов. Первый: вся информация в электронном виде должна храниться минимум на двух, а лучше трех локациях. Это, например, ваш рабочий компьютер, облако и внешнее хранилище (отдельный винчестер или даже флешка). Могут возникнуть проблемы нормативов безопасности хранения разных типов информации, шифрования, автоматизированной синхронизации, но все они решаемы. IT‑специалисты вашей организации наверняка смогут вас проконсультировать и дать полезные советы.

Второй принцип: информация должна храниться так, чтобы вы в любой момент могли быстро понять, чтó перед вами. Например, у меня такая стандартная схема называния статей и книг: фамилия автора, год выхода и начальные слова заголовка.

Третий принцип: сортируйте файлы по папкам сразу же, иначе потом просто не вспомните, что это и зачем вы это искали. Если совсем нет времени, по крайней мере сформируйте логические блоки. Папка «Загрузки» или «Данные», в которой лежит 500 файлов, — это страшно неэффективно.

Личную библиотеку удобно хранить в программах типа Zotero, Citavi, Mendeley. Там многое делается автоматически: например, можно настроить шаблон переименования файлов, эти программы могут сами скачивать библиографическую информацию и переименовывать файлы.

Также есть несколько важных принципов упорядочивания информации. Лучше иметь общее хранилище, куда будет «сваливаться» всё, чтó вы нашли. А внутри него лучше создать тематические папки. В большинстве библиографических менеджеров это реализовано через систему тэгов.

Если же вы делаете это вручную, то можно создать папку «Всё» и отдельно — например, папку «Грант № 3», где вы будете хранить информацию только по одному проекту. Главное — не переусложнить систему хранения.

Упорядочивание полезно не только потому, что оно экономит время. Это также инструмент, позволяющий вспомнить нужные детали по вашей теме, по-другому на нее взглянуть, увидеть что-то более наглядно. Поэтому важно хранить не только источники, но и свои мысли по поводу этих источников. Эти два пласта — найденные файлы и ваши замечания по поводу этих файлов — надо совместить.

В целом рабочий архив должен позволять вам быстрее входить в тему, вспоминать все мысли, которые у вас появлялись. Почти каждый из нас одновременно работает над несколькими проектами, и важно уметь быстро переключаться с одного на другой. Этому поможет еще один лайфхак: полезно вести журнал, фиксирующий этапы работы над проектом. Условно: «Вчера я скачал такие-то статьи, сегодня — прочитал одну, и она показалась мне любопытной по какой-то причине». Открыв после перерыва такой журнал, вы начнете работу сразу с той точки, где остановились. Это бывает полезно и при написании отчетов о проделанной по проекту работе: сильно упрощает процесс и экономит время.

Ну и главный принцип работы с архивом: каждое действие должно быть зафиксировано. Любые, даже на первый взгляд глупые, мысли нужно фиксировать, хотя бы для того, чтобы мысль не ходила по кругу. Иногда из глупости появляется что-то интересное, если достаточно долго над нею размышлять.
ДРУГИЕ МАТЕРИАЛЫ #4_2021