Написать научный труд в эпоху нейросетей: как сделать ИИ помощником?
Интеграция ИИ в научную работу требует глубокого понимания его возможностей, ограничений, рисков. Генеральный директор Edtech-компании «Лань» Александр Никифоров рассказывает, как использовать нейросети во благо при подготовке научной работы. The post Написать научный труд в эпоху нейросетей: как сделать ИИ помощником? appeared first on Хайтек.

От гипотезы до публикации: ИИ на всех этапах научного исследования
Главный эффект от применения генеративных сервисов — сокращение времени на выполнение рутинных задач. Существующие нейросетевые модели ChatGPT, Perplexity PRO, Writefull и Jenni AI помогают на всех этапах работы над научной статьей:
Генерация идей и гипотез
Нейросеть анализирует опубликованные исследования по определенной теме, выявляет недостаточно изученные области. Далее она формулирует на основе этих результатов гипотезы, предлагает методы исследования. Например, Semantic Scholar и Elicit (от Ought) подсказывают направления для новых гипотез на основе анализа научных публикаций. Пробелы в научных исследованиях помогает найти IBM Watson Discovery. Сервис Scite.ai ищет подтверждающие или опровергающие исследования, что помогает обосновать гипотезу. ChatGPT в режиме научного ассистента предлагает методы исследования.
Анализ научной литературы
Существует много ИИ-сервисов, облегчающих академическое письмо и умеющих работать с литературой: извлекать текст, делать сравнительный анализ, объединять выводы в обзор. Например, Perplexity.ai подбирает научные публикации по заданной теме. Российский сервис Sci-Hub AI использует ИИ для поиска научных публикаций и статей по ключевым словам и темам. Он помогает авторам эффективно собирать литературу, использовать цитаты и ссылки, упрощает создание библиографических списков. Инструмент крупнейшего научного издательского дома Elsevier — ScienceDirect AI — находит ответы среди миллионов рецензируемых полнотекстовых исследовательских статей и глав книг. Такие инструменты, как ResearchRabbit, связывают публикации в интерактивные карты, которые визуализируют взаимосвязи — в том числе неочевидные.
Анализ данных
Нейросетевые модели обладают большим потенциалом в анализе данных. Например, Pandas AI — надстройка над библиотекой анализа данных Pandas — позволяет автоматизировать обработку больших массивов информации, генерировать код для статистического анализа, интерпретировать результаты. В университетах и научных центрах для упрощения обработки больших массивов данных применяется сервис Naumen Data Science Platform. Это российское решение, которое подходит для анализа научных данных, автоматизирует подготовку отчетов, исследований, может генерировать тексты. Автоматизируя работу с данными, исследователь может делать неочевидные и более обоснованные выводы.
Написание и редактирование текста
При написании работы нейросети позволяют создать логически последовательный план, обеспечивают связность материала, группируют аргументы и доказательства, оформляют ссылки, интегрируют графики, таблицы, диаграммы. Например, ChatGPT преобразует набор тезисов в план статьи. На этапе редактирования — помогает сделать текст лаконичным, понятным, адаптировать под требования конкретного журнала, составить аннотацию, резюме готовой работы. Российский сервис Kampus AI на основе темы подбирает релевантные источники, формирует структуру, генерирует текст, проверяет уникальность работы. Подходит для написания научных статей по разным дисциплинам, но может не справляться с узкоспециализированными темами. У платформы Texterra есть ИИ-сервис, который помогает в написании научных статей, генерируя тексты на основе заданных тем и ключевых слов. Это упрощает подготовку к созданию полноценного исследования.
Работа с ИИ: баланс между возможностями и рисками
Использование нейросетей при подготовке научных работ пока остается дискуссионным вопросом в академическом сообществе. Эксперты отмечают ряд рисков:
- Публикация фальшивых статей. В 2021 году издательство Springer и Институт инженеров электротехники и электроники (IEEE) отозвали более 120 статей. Они были созданы с помощью программы SCIgen, которая генерирует «научные» тексты, иногда полностью вымышленные. В 2024 году было отозвано еще около 10 тысяч поддельных научных статей, сгенерированных при помощи ИИ. Отозванные статьи были опубликованы без должного рецензирования, что поставило под сомнение стандарты проверки качества материалов в этих изданиях.
- Фальсификация авторства. В 2021 году профессор Дэвид Кокс обнаружил свое имя в двух статьях, опубликованных китайскими исследователями. Еще в одной статье было указано вымышленное имя автора «Билл Фрэнкс». Это выявило проблемы в системе научного рецензирования и контроля авторства.
- Некорректные изображения. В 2024 году в журнале Frontiers in Cell and Developmental Biology была опубликована статья с изображениями крысы, сгенерированными ИИ. Они оказались некорректными, что вызвало критику в адрес журнала. При этом сам материал прошел несколько этапов проверки: написали статью китайские ученые, отредактировали индийские исследователи, а перед публикацией ее проверяли рецензенты из США и Индии. Но никто из них не догадался проверить подлинность иллюстраций.
Но это не значит, что надо вовсе отказаться от нейросетей: нужно формировать культуру работы с ИИ-моделями.
Как избежать рисков при работе с ИИ
Ответственное использование. Нейросети способны создавать фиктивные сведения, искажать статистику, придумывать источники, ошибаться в цитировании и вымывать имена авторов и т. д.
Чтобы снизить риск, нужно использовать сервисы, работающие на основе верифицированного контента. Кроме того, автор должен самостоятельно проверять выводы, цитаты, цифры, ссылки. За автором остается контроль над ключевыми аспектами работы: постановкой проблемы, интерпретацией результатов, формулированием выводов. Фактчекинг и критическое осмысление текста, сгенерированного искусственным интеллектом, поможет избежать ошибок и неточностей.
Уникальность и оригинальность исследования. ИИ — это инструмент, а не соавтор. Работа должна отражать оригинальное исследование автора. В любой научной работе есть заимствования, и их нужно правильно оформлять: указывать автора, источник, библиографические сведения. Автору необходимо уточнять в промпте к ИИ-сервису, что все цитаты в сгенерированном тексте должны быть с указанием авторства и источника. Так как нейросети могут воспроизводить фрагменты опубликованных работ без указания источника, необходимо следить за уникальностью.
Выбор ИИ-инструментов. Искусственный интеллект автоматизирует разные виды работ: распознавание речи, анализ научных статей, визуализация данных, поиск литературы, фактчекинг, редактирование готовой работы и т. д. Выбор инструмента должен основываться на потребностях исследователя, специфике задачи.
Соблюдение этических норм. Многие научные журналы запрещают указывать ИИ в качестве соавтора, требуют раскрытия информации об использовании нейросетей при подготовке научных работ. Это обеспечивает прозрачность, уменьшает риск недоверия.
Со временем правила применения ИИ-инструментов при подготовке научных работ должны стать частью академической этики.
Заменят ли нейросети ученых: будущее научных работ
В ближайшие годы будут появляться новые инструменты, которые облегчают академическое письмо. Нейросетевые модели будут все больше интегрироваться в научную работу. Например, уже сейчас такие платформы, как Perplexity AI, предлагают специализированные решения для ученых: поиск литературы, анализ данных и т. п. В ЭБС «Лань» есть система видеорекомендаций с образовательных каналов к открытой странице книги в электронной библиотеке, улучшенный поиск для нахождения максимально релевантного ответа. Также компания разрабатывает генеративный сервис, который позволяет сгенерировать ответ на основе верифицированных научных и учебных источников, указывает в ответе ссылки на источники.
Применение ИИ может привести к резкому увеличению опубликованных работ, а это девальвирует вес и значимость письменных источников. Нельзя исключать вероятность, что уже существуют опубликованные материалы, полностью созданные нейросетями. В академическом сообществе уже принимаются меры, которые должны обеспечить баланс, учитывающий потенциал и риски технологий.
Новые редакционные политики. Большинство журналов требует от авторов обязательно указывать использование ИИ при подготовке статьи, например, ChatGPT для генерации текста или DALL·E для создания изображений. Также запрещено указывать искусственный интеллект как соавтора работы, так как он не может нести ответственность за ее содержание. Все публикации в рецензируемых журналах проходят через специализированные системы, позволяющие выявлять ИИ-сгенерированные тексты и изображения.
Ужесточение рецензирования. В журналах внедряются многоступенчатые проверки статей, включающие технический и визуальный аспекты. Нередко от автора требуется предоставить исходные данные: код, лог-файлы, скрипты. В первую очередь это касается статей, написанных с использованием ИИ-моделей.
Разработка инструментов выявления сгенерированного контента. Для проверки статей используются инструменты, способные отличать сгенерированный контент от настоящих. Например, для этого используются DetectGPT, GPTZero. Среди российских аналогов — Antiplagiat. Этот сервис использует ИИ для проверки уникальности текстов, помогает избегать плагиата в научных работах, выявляет сгенерированный контент. Также сервис может дать рекомендации по улучшению уникальности и структуры работы. Некоторые издательства стали использовать специальные метки или водяные знаки для сгенерированных элементов.
Разработка стандартов этичного использования ИИ. В 2020 году Международная федерация библиотечных ассоциаций и учреждений (IFLA) выпустила заявление с ключевыми соображениями по использованию технологий ИИ и машинного обучения в библиотечном секторе. В 2021 году рекомендации по этическому использованию нейросетей были приняты UNESCO. Это первый глобальный нормативный документ в области ИИ. Работу над разработкой рекомендаций ведут Nature, Elsevier. В 2023 году объединение 24 британских вузов Russell Group разработало рекомендации по использованию ИИ для университетов. Среди принципов — поддержка грамотности в области искусственного интеллекта студентов и преподавателей. Внутренние регламенты по применению нейросетей вводят университеты, исследовательские центры.
Протоколы FAIR и CARE усиливают контроль над использованием данных: они должны быть открытыми, проверяемыми, репрезентативными. В первую очередь это касается социальных наук, биомедицины.
Обучение и просвещение. Проводятся обучающие курсы по этике и ответственному использованию нейросетей в научной среде. В начале преподаватели вузов высказывали недоверие и опасения, что студенты начнут массово использовать нейросети, передадут им существенную часть своих задач. Сейчас они активно учатся сами применять искусственный интеллект в своей работе. Например, в компании «Лань» есть курсы повышения квалификации для преподавателей вузов. Модуль, посвященный сервисам на базе ИИ, стал самым популярным среди преподавателей и в целом в академической среде, которая сильно завязана на написании текстов.
Широкое проникновение нейросетей потребует от ученых новых навыков. В первую очередь важно научиться составлять уточненные запросы, сохранить навык написания структурированной письменной речи. Это говорит о степени и глубине понимания темы человеком. Искусственный интеллект — это не соавтор, а инструмент. Поэтому нельзя слепо ему доверять, нужно проверять все сгенерированные результаты, верифицировать выводы.
Обложка: downloaded from Freepik
The post Написать научный труд в эпоху нейросетей: как сделать ИИ помощником? appeared first on Хайтек.