Google Research healthcare LLM превосходит врачей в ключевых областях

Система искусственного интеллекта Google, обученная проводить медицинские интервью, превосходит врачей-людей в таких областях, как умение вести себя у постели больного и точность диагностики.

Разработана командами DeepMind и Google Research и в настоящее время Опубликовано на ArXivЧатбот, получивший название Articulate Medical Intelligence Explorer (AMIE), отлично справлялся с диагностикой респираторных и сердечно-сосудистых заболеваний, а также других.

Они сравнялись или даже превзошли сертифицированных врачей первичного звена в сборе информации о пациентах во время медицинских интервью и получили более высокие баллы за эмпатию.

Рады представить нашу новую исследовательскую работу AMIE (Articulate Medical Intelligence Explorer), шаг к разговорному диагностическому ИИ. @GoogleAI @GoogleHealth @GoogleDeepMind https://t.co/KIl1cYjgWO pic.twitter.com/JcPAiNcPgJ

- Майк Шакерманн (@HardyShakerman) 12 января 2024 года

Одной из ключевых проблем при разработке AMIE была нехватка реальных медицинских разговоров для получения обучающих данных.

Чтобы решить эту проблему, команда Google Health, в том числе исследователь искусственного интеллекта Вивек Натараджан, разработала метод, позволяющий чатботу участвовать в симулированных "разговорах".

ИИ был обучен играть роли пациента, сопереживающего врача и критика, оценивающего взаимодействие врача и пациента.

В тестах с участием 20 актеров, обученных имитировать пациентов, и 20 дипломированных врачей AMIE неизменно соответствовал или превосходил точность диагностики врачей в шести медицинских специальностях.

Она превзошла врачей по 24 из 26 критериев качества разговора, таких как вежливость и объяснение условий и методов лечения.

Алан Картикесалингам, научный сотрудник отдела клинических исследований Google Health в Лондоне и соавтор исследования, отметил: "Насколько нам известно, это первый случай, когда система разговорного ИИ была разработана оптимально для ведения диагностического диалога и сбора истории болезни".

Рады представить AMIE (Articulate Medical Intelligence Explorer) - наш исследовательский LLM для диагностических бесед. В рандомизированном исследовании в стиле "виртуального OSCE" AMIE превзошел докторов первичной медицинской помощи по качеству беседы и точности диагностики. Препринт https://t.co/XZizS9PtDG (1/7) pic.twitter.com/3t8hTkLmO9

- Алан Картикесалингам (@alan_karthi) 12 января 2024 года

Однако Картикесалингам подчеркивает, что AMIE остается экспериментальной и не тестировалась на реальных пациентах, а только на актерах, изображающих вымышленные, но правдоподобные медицинские состояния.

Как проходило исследование

Исследование под названием "Towards Conversational Diagnostic AI" представляет AMIE, LLM, разработанный для взаимодействия в области медицинской диагностики.

Вот более подробная информация о том, как это работает:

Разработка AMIE: Articulate Medical Intelligence Explorer (AMIE) - это система искусственного интеллекта, основанная на большой языковой модели (LLM), созданной компанией Google. Она оптимизирована для диагностического диалога в медицинских контекстах. AMIE была разработана для эмуляции сложного процесса сбора клинической истории болезни и диагностических рассуждений.
Имитационное обучение диалогу: Исследователи разработали новую самоигральную симуляционную среду из-за отсутствия реальных медицинских бесед для обучения. Это позволило AMIE участвовать в симулированных диалогах, играя различные роли (пациента, врача, критика) для повышения эффективности обучения. Эти диалоги охватывали целый ряд медицинских заболеваний, специальностей и контекстов.
Тонкая настройка инструкции и стратегия цепочки рассуждений: AMIE подвергся тонкой настройке с использованием различных наборов реальных данных, включая ответы на медицинские вопросы, рассуждения, обобщения и данные диалогов. Стратегия цепочки рассуждений включает анализ информации о пациенте, формулирование ответов и действий, а также уточнение ответов на основе текущего разговора.
Дистанционное исследование объективного структурированного клинического экзамена (OSCE): Исследователи провели рандомизированное двойное слепое перекрестное исследование, в котором сравнивали AMIE с врачами первичной медицинской помощи (PCP). В исследовании использовались текстовые консультации со 149 симулированными пациентами, изображенными актерами в различных клинических сценариях. Врачи-специалисты и пациенты-актеры оценивали работу AMIE и PCP.
Оценка и результаты: Оценка была сосредоточена на точности диагностики, аргументации управления, коммуникативных навыках и эмпатии. AMIE продемонстрировали более высокие показатели по сравнению с PCP в нескольких областях, включая точность диагностики и эмпатию.

Исследователи предупреждают, что пока к этим результатам следует относиться осторожно, отмечая такие недостатки исследования, как использование интерфейса текстового чата и отсутствие реальных взаимодействий с пациентами.

Однако он знаменует собой прогресс на пути к созданию систем искусственного интеллекта, способных проводить медицинские интервью и диагностические диалоги.

Генеративный ИИ в здравоохранении пользуется огромным успехом: модели успешно поиск новых антибиотиков, повышение качества колоноскопии, и моделирование взаимодействий между соединениями и биологическими процессами.

Могут ли модели искусственного интеллекта теперь также выполнять функции, связанные с пациентами?

Google Research healthcare LLM превосходит врачей в ключевых областях

Как проходило исследование

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Google Research healthcare LLM превосходит врачей в ключевых областях

Как проходило исследование

Присоединяйтесь к будущему

Сэм Джинс

СВЯЗАННЫЕ СТАТЬИ

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDFБудьте впереди с DailyAI

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI