Команда под руководством Принстона бьет тревогу: ИИ представляет риск для научной целостности

ИИ меняет научные исследования, но без надлежащего руководства он может принести больше вреда, чем пользы.

К такому выводу пришел новая газета Опубликовано в журнале Science Advances междисциплинарной командой из 19 исследователей под руководством компьютерщиков Принстонского университета Арвинда Нараянана и Саяша Капура.

Команда утверждает, что неправильное использование машинного обучения в научных дисциплинах приводит к кризису воспроизводимости, который угрожает подорвать сами основы науки.

"Когда мы переходим от традиционных статистических методов к методам машинного обучения, появляется гораздо больше способов выстрелить себе в ногу". сказал Нараянан.который руководит Центром политики в области информационных технологий Принстона.

"Если мы не предпримем меры по улучшению наших научных стандартов и стандартов отчетности, когда речь идет о науке, основанной на машинном обучении, мы рискуем, что не только одна дисциплина, но и множество различных научных дисциплин будут открывать эти кризисы один за другим".

По мнению авторов, проблема заключается в том, что машинное обучение стремительно внедряется практически во все научные области, зачастую без четких стандартов, обеспечивающих целостность и воспроизводимость результатов.

Они подчеркивают, чтоУже опубликованы тысячи работ, в которых используются несовершенные методы машинного обучения.

Но команда специалистов из Принстона утверждает, что еще есть время, чтобы избежать надвигающегося кризиса. Они предложили простой список лучших практик, которые, если их широко внедрить, смогут обеспечить надежность машинного обучения в науке.

Контрольный список, получивший название REFORMS (Recommendations for Machine-learning-based Science), состоит из 32 вопросов по восьми ключевым направлениям:

Цели исследования: Четко сформулируйте научное утверждение и то, как машинное обучение будет использоваться для его подтверждения. Обоснуйте выбор машинного обучения вместо традиционных статистических методов.
Воспроизводимость вычислений: Предоставьте код, данные, спецификации вычислительной среды, документацию и сценарий воспроизведения, необходимые для самостоятельного воспроизведения результатов исследования.
Качество данных: Задокументируйте источники данных, структуру выборки, итоговые переменные, размер выборки и количество отсутствующих данных. Обоснуйте, что набор данных является подходящим и репрезентативным для научного вопроса.
Предварительная обработка данных: Сообщите, как данные были очищены, преобразованы и разделены на обучающие и тестовые наборы. Обоснуйте, какие данные были исключены.
Моделирование: Опишите и обоснуйте все опробованные модели, метод, использованный для выбора окончательной модели (моделей), и процесс настройки гиперпараметров. Сравните производительность с соответствующими базовыми показателями.
Утечка данных: Убедитесь, что в процессе моделирования не была случайно использована информация из тестовых данных и что входные характеристики не просачиваются в результат.

"Это системная проблема с системными решениями", - объясняет Капур.

Однако расходы, связанные с неправильным выбором может быть огромным. Ошибки в науке могут загубить перспективные исследования, оттолкнуть исследователей и подорвать доверие общества к науке.

Предыдущие исследования, такие как Масштабное исследование природы академиков, посвященный генеративному ИИ в науке, показал, что более глубокая и постепенная интеграция ИИ в научные процессы неизбежна.

Участники подчеркнули множество преимуществ: 66% отметили, что ИИ позволяет быстрее обрабатывать данные, 58% считают, что он улучшает вычисления, а 55% заявили, что он экономит время и деньги.

Однако 531 человек считает, что результаты могут быть невоспроизводимыми, 581 человек беспокоится о предвзятости, а 551 человек считает, что ИИ может стать причиной мошеннических исследований.

Мы наблюдали свидетельства этого, когда исследователи опубликовал статью с нелепыми диаграммами, сгенерированными ИИ, в журнале Frontiers - крыса с гигантскими яичками, не меньше. Комично, но это показало, как рецензирование может не уловить даже очевидные случаи использования ИИ.

В конечном счете, как и любой другой инструмент, ИИ безопасен и эффективен лишь в той мере, в какой за ним стоит человек. Неосторожное использование, даже непреднамеренное, может сбить науку с пути.

По словам Нараянана, новые правила направлены на то, чтобы "честные люди оставались честными".

Широкое распространение среди исследователей, рецензентов и журналов может установить новый стандарт научной честности в эпоху ИИ.

Однако достижение консенсуса будет непростой задачей, тем более что кризис воспроизводимости и так находится в тени.

Группа специалистов под руководством Принстона бьет тревогу: ИИ представляет риск для научной целостности

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter