Система искусственного интеллекта, разработанная на основе комплексных персональных данных из Дании, продемонстрировала поразительную точность в прогнозировании риска смерти человека.
Этот ИИ, задокументированный в Исследование опубликовано в журнале Nature Computational ScienceОн был создан Суне Леманн Йоргенсен и ее командой из Технического университета Дании.
Они проанализировали огромный массив данных, включающий множество факторов из жизни населения Дании, в том числе данные об образовании, посещениях врачей, диагнозах, доходах и профессиях шести миллионов человек за период с 2008 по 2020 год.
Затем эти данные были преобразованы в формат, пригодный для обучения большой языковой модели (LLM). TРазработанная командой модель Life2vec анализирует события жизни человека и прогнозирует вероятные будущие результаты, подобно тому, как LLM обрабатывает язык.
Чтобы проверить Life2vec, команда зарезервировала данные за последние четыре года и сосредоточилась на людях в возрасте от 35 до 65 лет, половина из которых скончалась в период с 2016 по 2020 год.
Прогнозы Life2vec о том, кто выживет, а кто нет, превзошли все существующие модели искусственного интеллекта и актуарные таблицы жизни (используемые в страховой индустрии) примерно на 11%. Модель также использовалась для прогнозирования личностных особенностей, демонстрируя способность модели сопоставлять масштабные общественные факторы с результатами на индивидуальном уровне.
Йоргенсен рассматривает эту модель как инструмент раннего выявления медицинских и социальных проблем, который может помочь правительствам в сокращении неравенства в здравоохранении и социальной сфере. Она выявляет взаимосвязь между смертностью и уровнем экономики, труда, дохода и годом рождения, предоставляя еще одно направление для изучения влияния этих типов макродемографических факторов на здоровье человека.
Однако Йоргенсен предостерегает от возможного злоупотребления в бизнесе, особенно в страховой отрасли, где это может нарушить основополагающий принцип разделения рисков.
Если страховщики будут использовать ИИ для определения того, когда конкретный человек подвергается повышенному риску смерти, это вызовет сложную этическую дискуссию. Это в некоторой степени напоминает другие виды использования ИИ для прогнозирования, такие как программы предиктивной работы полицииВ них люди рассматриваются как потенциальные "подозреваемые" еще до совершения ими возможного преступления.
Йоргенсен сказал по этому поводу"Очевидно, что наша модель не должна использоваться страховой компанией, поскольку вся идея страхования заключается в том, что, разделяя недостаток знаний о том, кто окажется тем невезучим человеком, которого постигнет какое-то происшествие, или смерть, или потеря рюкзака, мы можем как бы разделить это бремя".
Подробнее об исследовании
Вот дополнительная информация о целях исследования, новаторском подходе и о том, как оно проходило:
- Сбор и преобразование данных: Исследовательская группа собрала обширную базу данных, охватывающую все население Дании за период с 2008 по 2016 год и включающую около шести миллионов жителей. Этот набор данных включал в себя подробные ежедневные записи различных жизненных событий, включая случаи, связанные со здоровьем, уровень образования, статус занятости, уровень дохода, место жительства и рабочее время.
- Создание синтетического языка для жизненных событий: Исследователи преобразовали эти жизненные события в формат, напоминающий язык, что позволило использовать методы обработки естественного языка. Они рассматривали каждое жизненное событие как "предложение", состоящее из "понятийных лексем", которые включали подробную информацию о типе события, уровне дохода и типе работы.
- Разработка модели Life2vec: Используя трансформаторную архитектуру, команда разработала модель. Эта модель может отражать сложные отношения между различными жизненными событиями, подобно тому, как LLM понимают отношения между словами.
- Прогнозирующий анализ и тестирование: Модель Life2vec была протестирована на способность предсказывать различные результаты, в частности раннюю смертность и личностные качества. При прогнозировании смертности модель оценивала вероятность того, что человек проживет четыре года после 2016 года. По этому показателю она превзошла традиционные модели.
- Понимание и интерпретация модели: Для интерпретации предсказаний модели исследователи использовали такие методы, как векторы активации концепций (TCAV). Это включало в себя определение жизненных направлений, соответствующих различным жизненным результатам или чертам характера. Анализируя эти направления, они получили представление о том, как такие факторы, как статус занятости или состояние здоровья, влияют на предсказания модели.
Использование искусственного интеллекта для предсказания важных жизненных событий, одним из которых, несомненно, является смерть, - заманчивая перспектива.
Несмотря на то, что преимущества и риски тесно сбалансированы, подобные приложения были направлены на положительный результат, как, например, эта модель, используемая для прогнозируют подростковые самоубийства и самоповреждения. В здравоохранении в целом предиктивное моделирование помогает определить приоритетность лечения для групп риска.
Однако, как признает Йоргенсен, предстоит еще поработать над защитой этического использования этих технологий.