Система искусственного интеллекта Google, обученная проводить медицинские интервью, превосходит врачей-людей в таких областях, как умение вести себя у постели больного и точность диагностики.
Разработана командами DeepMind и Google Research и в настоящее время Опубликовано на ArXivЧатбот, получивший название Articulate Medical Intelligence Explorer (AMIE), отлично справлялся с диагностикой респираторных и сердечно-сосудистых заболеваний, а также других.
Они сравнялись или даже превзошли сертифицированных врачей первичного звена в сборе информации о пациентах во время медицинских интервью и получили более высокие баллы за эмпатию.
Рады представить нашу новую исследовательскую работу AMIE (Articulate Medical Intelligence Explorer), шаг к разговорному диагностическому ИИ. @GoogleAI @GoogleHealth @GoogleDeepMindhttps://t.co/KIl1cYjgWO pic.twitter.com/JcPAiNcPgJ
- Майк Шакерманн (@HardyShakerman) 12 января 2024 года
Одной из ключевых проблем при разработке AMIE была нехватка реальных медицинских разговоров для получения обучающих данных.
Чтобы решить эту проблему, команда Google Health, в том числе исследователь искусственного интеллекта Вивек Натараджан, разработала метод, позволяющий чатботу участвовать в симулированных "разговорах".
ИИ был обучен играть роли пациента, сопереживающего врача и критика, оценивающего взаимодействие врача и пациента.
В тестах с участием 20 актеров, обученных имитировать пациентов, и 20 дипломированных врачей AMIE неизменно соответствовал или превосходил точность диагностики врачей в шести медицинских специальностях.
Она превзошла врачей по 24 из 26 критериев качества разговора, таких как вежливость и объяснение условий и методов лечения.
Алан Картикесалингам, научный сотрудник отдела клинических исследований Google Health в Лондоне и соавтор исследования, отметил: "Насколько нам известно, это первый случай, когда система разговорного ИИ была разработана оптимально для ведения диагностического диалога и сбора истории болезни".
Рады представить AMIE (Articulate Medical Intelligence Explorer) - наш исследовательский LLM для диагностических бесед. В рандомизированном исследовании в стиле "виртуального OSCE" AMIE превзошел докторов первичной медицинской помощи по качеству беседы и точности диагностики. Препринт ➡️ https://t.co/XZizS9PtDG (1/7) pic.twitter.com/3t8hTkLmO9
- Алан Картикесалингам (@alan_karthi) 12 января 2024 года
Однако Картикесалингам подчеркивает, что AMIE остается экспериментальной и не тестировалась на реальных пациентах, а только на актерах, изображающих вымышленные, но правдоподобные медицинские состояния.
Как проходило исследование
Исследование под названием "Towards Conversational Diagnostic AI" представляет AMIE, LLM, разработанный для взаимодействия в области медицинской диагностики.
Вот более подробная информация о том, как это работает:
- Разработка AMIE: Articulate Medical Intelligence Explorer (AMIE) - это система искусственного интеллекта, основанная на большой языковой модели (LLM), созданной компанией Google. Она оптимизирована для диагностического диалога в медицинских контекстах. AMIE была разработана для эмуляции сложного процесса сбора клинической истории болезни и диагностических рассуждений.
- Имитационное обучение диалогу: Исследователи разработали новую самоигральную симуляционную среду из-за отсутствия реальных медицинских бесед для обучения. Это позволило AMIE участвовать в симулированных диалогах, играя различные роли (пациента, врача, критика) для повышения эффективности обучения. Эти диалоги охватывали целый ряд медицинских заболеваний, специальностей и контекстов.
- Тонкая настройка инструкции и стратегия цепочки рассуждений: AMIE подвергся тонкой настройке с использованием различных наборов реальных данных, включая ответы на медицинские вопросы, рассуждения, обобщения и данные диалогов. Стратегия цепочки рассуждений включает анализ информации о пациенте, формулирование ответов и действий, а также уточнение ответов на основе текущего разговора.
- Дистанционное исследование объективного структурированного клинического экзамена (OSCE): Исследователи провели рандомизированное двойное слепое перекрестное исследование, в котором сравнивали AMIE с врачами первичной медицинской помощи (PCP). В исследовании использовались текстовые консультации со 149 симулированными пациентами, изображенными актерами в различных клинических сценариях. Врачи-специалисты и пациенты-актеры оценивали работу AMIE и PCP.
- Оценка и результаты: Оценка была сосредоточена на точности диагностики, аргументации управления, коммуникативных навыках и эмпатии. AMIE продемонстрировали более высокие показатели по сравнению с PCP в нескольких областях, включая точность диагностики и эмпатию.
Исследователи предупреждают, что пока к этим результатам следует относиться осторожно, отмечая такие недостатки исследования, как использование интерфейса текстового чата и отсутствие реальных взаимодействий с пациентами.
Однако он знаменует собой прогресс на пути к созданию систем искусственного интеллекта, способных проводить медицинские интервью и диагностические диалоги.
Генеративный ИИ в здравоохранении пользуется огромным успехом: модели успешно поиск новых антибиотиков, повышение качества колоноскопии, и моделирование взаимодействий между соединениями и биологическими процессами.
Могут ли модели искусственного интеллекта теперь также выполнять функции, связанные с пациентами?