Google Research healthcare LLM превосходит врачей в ключевых областях

12 января 2024 года

AI

Система искусственного интеллекта Google, обученная проводить медицинские интервью, превосходит врачей-людей в таких областях, как умение вести себя у постели больного и точность диагностики. 

Разработана командами DeepMind и Google Research и в настоящее время Опубликовано на ArXivЧатбот, получивший название Articulate Medical Intelligence Explorer (AMIE), отлично справлялся с диагностикой респираторных и сердечно-сосудистых заболеваний, а также других. 

Они сравнялись или даже превзошли сертифицированных врачей первичного звена в сборе информации о пациентах во время медицинских интервью и получили более высокие баллы за эмпатию.

Одной из ключевых проблем при разработке AMIE была нехватка реальных медицинских разговоров для получения обучающих данных. 

Чтобы решить эту проблему, команда Google Health, в том числе исследователь искусственного интеллекта Вивек Натараджан, разработала метод, позволяющий чатботу участвовать в симулированных "разговорах". 

ИИ был обучен играть роли пациента, сопереживающего врача и критика, оценивающего взаимодействие врача и пациента.

В тестах с участием 20 актеров, обученных имитировать пациентов, и 20 дипломированных врачей AMIE неизменно соответствовал или превосходил точность диагностики врачей в шести медицинских специальностях.

Она превзошла врачей по 24 из 26 критериев качества разговора, таких как вежливость и объяснение условий и методов лечения.

Алан Картикесалингам, научный сотрудник отдела клинических исследований Google Health в Лондоне и соавтор исследования, отметил: "Насколько нам известно, это первый случай, когда система разговорного ИИ была разработана оптимально для ведения диагностического диалога и сбора истории болезни". 

Однако Картикесалингам подчеркивает, что AMIE остается экспериментальной и не тестировалась на реальных пациентах, а только на актерах, изображающих вымышленные, но правдоподобные медицинские состояния.

Как проходило исследование

Исследование под названием "Towards Conversational Diagnostic AI" представляет AMIE, LLM, разработанный для взаимодействия в области медицинской диагностики. 

Вот более подробная информация о том, как это работает:

  1. Разработка AMIE: Articulate Medical Intelligence Explorer (AMIE) - это система искусственного интеллекта, основанная на большой языковой модели (LLM), созданной компанией Google. Она оптимизирована для диагностического диалога в медицинских контекстах. AMIE была разработана для эмуляции сложного процесса сбора клинической истории болезни и диагностических рассуждений. 
  2. Имитационное обучение диалогу: Исследователи разработали новую самоигральную симуляционную среду из-за отсутствия реальных медицинских бесед для обучения. Это позволило AMIE участвовать в симулированных диалогах, играя различные роли (пациента, врача, критика) для повышения эффективности обучения. Эти диалоги охватывали целый ряд медицинских заболеваний, специальностей и контекстов.
  3. Тонкая настройка инструкции и стратегия цепочки рассуждений: AMIE подвергся тонкой настройке с использованием различных наборов реальных данных, включая ответы на медицинские вопросы, рассуждения, обобщения и данные диалогов. Стратегия цепочки рассуждений включает анализ информации о пациенте, формулирование ответов и действий, а также уточнение ответов на основе текущего разговора.
  4. Дистанционное исследование объективного структурированного клинического экзамена (OSCE): Исследователи провели рандомизированное двойное слепое перекрестное исследование, в котором сравнивали AMIE с врачами первичной медицинской помощи (PCP). В исследовании использовались текстовые консультации со 149 симулированными пациентами, изображенными актерами в различных клинических сценариях. Врачи-специалисты и пациенты-актеры оценивали работу AMIE и PCP.
  5. Оценка и результаты: Оценка была сосредоточена на точности диагностики, аргументации управления, коммуникативных навыках и эмпатии. AMIE продемонстрировали более высокие показатели по сравнению с PCP в нескольких областях, включая точность диагностики и эмпатию. 

Исследователи предупреждают, что пока к этим результатам следует относиться осторожно, отмечая такие недостатки исследования, как использование интерфейса текстового чата и отсутствие реальных взаимодействий с пациентами.

Однако он знаменует собой прогресс на пути к созданию систем искусственного интеллекта, способных проводить медицинские интервью и диагностические диалоги. 

Генеративный ИИ в здравоохранении пользуется огромным успехом: модели успешно поиск новых антибиотиков, повышение качества колоноскопии, и моделирование взаимодействий между соединениями и биологическими процессами.

Могут ли модели искусственного интеллекта теперь также выполнять функции, связанные с пациентами?

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения