ИИ, читающий мысли: прорыв в медицине или шаг к антиутопии?

18 августа 2023 года

ИИ читает мысли

Наши мысли могут быть нашим внутренним святилищем, но они не являются запретными для ИИ.

ИИ, читающий мысли, кажется сюжетом из научно-фантастического романа, однако он открывает огромные перспективы для людей, которые не могут общаться из-за паралича или травм мозга.

Кроме того, доступ ИИ к мозгу позволит нам писать, создавать и проектировать, опираясь на одни лишь мысли, или предоставлять другим людям возможность заглянуть в наше сознание.

На протяжении почти десяти лет технология электроэнцефалограммы (ЭЭГ), которая фиксирует электрические сигналы с помощью электродов на коже головы, помогает людям, страдающим от тяжелых инсультов и синдрома полной блокировки (CLIP) - состояния, когда человек находится в сознании, но обездвижен. 

В 2014 году итальянец Ансельмо Пальялонга, страдающий боковым амиотрофическим склерозом (БАС), использовал Интегрированная в машинное обучение гарнитура общаться с помощью ответов "да" или "нет", несмотря на то, что не может пошевелить ни одним мускулом. Некоторые люди, страдающие этим заболеванием, могут двигать крошечными мышцами, как Стивен Хокинг, который может подергать мышцу щеки. 

Интерфейс "мозг-компьютер" Emotiv
Компьютерно-мозговой интерфейс Emotiv. Источник: Emotiv.

По мере развития искусственного интеллекта исследователи преодолевают разрыв от простой интерпретации сигналов до полного перевода сложных мыслей. 

Со временем люди смогут говорить и общаться, не двигая мускулами, буквально силой мысли. 

Эта же технология может позволить нам управлять сложными машинами с помощью мозга, сочинять музыку, представляя себе мелодию, или писать и рисовать, создавая образы в своем воображении. Мы даже можем "записывать" свои сны с помощью мозговых волн и воспроизводить их позже.

В недалеком будущем ИИ, читающий мысли, может быть использован для принудительного чтения воспоминаний человека, например, чтобы проверить его на причастность к преступлению. 

Хакеры могут даже ненадолго обмануть вас, заставив представить свою личную информацию, при этом извлекая копию ваших мыслей из мозга. Тоталитарные режимы могли бы проводить обычные тесты на гражданах, чтобы отслеживать отклонения в их мыслях. 

Более того, обладая способностью преобразовывать мысли в компьютерную реальность, люди могли бы проводить свою жизнь в песочнице снов, где они могли бы лепить свои реальности по своему усмотрению.

Сейчас такие приложения кажутся сюрреалистичными и фантастическими, но несколько недавних экспериментов заложили основу для будущего, в котором мозг будет доступен для ИИ. 

ИИ читает ваши мысли

Так как же все это возможно?

Чтобы преобразовать мозговую активность в пригодный для использования результат, который можно передать в компьютер, сначала необходимо провести точные измерения. 

Это первое препятствие, ведь мозг - это такая же загадка, как самые дальние уголки космоса или самые глубокие океаны. Не существует единого мнения о том, как нейронная активность порождает сложные мысли, не говоря уже о сознании. 

Человеческий мозг - как и другие нервные системы в природе - является домом для миллиардов нейронов, большинство из которых срабатывают от 5 до 100 раз в секунду. В человеческом мозге каждая секунда мышления включает в себя триллионы отдельные нейронные действия.

Измерение нейронной активности на гранулированном уровне - это святой грааль для нейронаук, но сейчас это невозможно - особенно с помощью неинвазивных методов. 

В настоящее время измерения мозга носят более целостный характер, получая данные о движении крови или обмене электрическими сигналами. Существует три хорошо зарекомендовавших себя метода измерения активности мозга:

  • Магнитоэнцефалография (МЭГ) фиксирует магнитные поля, генерируемые электрической активностью мозга, и позволяет получить представление об активности нейронов в режиме реального времени.
  • Электроэнцефалография (ЭЭГ) для интерпретации электрической активности.
  • Магнитно-резонансная томография (МРТ), которая измеряет активность мозга с помощью показателей кровотока.
фМРТ
ФМРТ измеряет динамику кровотока в мозге. Источник: Shutterstock.

Машинное обучение (ML) и искусственный интеллект объединились со всеми тремя технологиями, чтобы улучшить анализ сложных сигналов. 

Конечная цель - связать конкретные действия мозга с определенными мыслями, которые могут включать слово, образ или что-то более семантическое и абстрактное.

Технологии, позволяющие получать данные из мозга и передавать их в компьютер, называются интерфейсами мозг-компьютер (BCI).

Вот основной процесс, как это работает:

  1. Презентация стимула: Участники подвергаются воздействию различных стимулов. Это могут быть изображения, звуки или даже тактильные ощущения. Во время этого воздействия регистрируется активность мозга, обычно с помощью ЭЭГ или МРТ.
  2. Сбор данных: Реакция мозга на эти стимулы записывается в режиме реального времени. Эти данные становятся богатым источником информации о том, как различные стимулы влияют на активность мозга.
  3. Предварительная обработка: Необработанные данные о мозге часто зашумлены. Прежде чем их можно будет использовать, их необходимо очистить и стандартизировать. Это может включать удаление артефактов, нормализацию сигналов или выравнивание точек данных.
  4. Машинное обучение: На основе обработанных данных вводятся модели машинного обучения. Эти модели обучаются находить закономерности или корреляции между данными мозга и соответствующим стимулом. По сути, ИИ выступает в роли переводчика, расшифровывающего "язык" мозга.
  5. Обучение моделей: Это итеративный процесс. Чем больше данных получает модель, тем лучше она делает прогнозы или генерирует результаты. Этот этап может потребовать значительного времени и вычислительных мощностей.
  6. Валидация: После обучения точность модели проверяется. Обычно это делается путем предъявления новых стимулов участникам, записи их мозговой активности, а затем использования модели для прогнозирования или генерирования результатов на основе этих новых данных.
  7. Обратная связь и доработка: Основываясь на результатах проверки, исследователи настраивают и совершенствуют модель, итерационно добиваясь максимальной точности.
  8. Приложение: После проверки приложение используется по назначению, будь то помощь парализованному человеку в общении, генерирование образов из мыслей или любое другое применение.

За последние пару лет методы искусственного интеллекта стремительно развивались, позволяя исследователям работать со сложными и шумными данными мозга, извлекать мимолетные мысли и преобразовывать их в то, с чем может работать компьютер. 

Например. Проект 2022 года Компания Meta использовала данные МЭГ и ЭЭГ 169 человек для обучения искусственного интеллекта распознавать услышанные ими слова из заранее определенного списка, состоящего из 793 слов. ИИ смог создать список из 10 слов, содержащий выбранное слово, в 73% случаев, доказав, что ИИ может "читать мысли", хотя и с ограниченной точностью.  

В марте 2023 года, исследователи представили революционный ИИ-декодер для преобразования мозговой активности в непрерывные текстовые потоки. 

ИИ продемонстрировал поразительную точность, преобразуя истории, которые люди слушали или представляли, в текст с помощью данных фМРТ. 

Доктор Александр Хут из Техасского университета в Остине выразил удивление эффективностью системы, заявив: "Мы были потрясены тем, что она работает так хорошо, как работает. Я работаю над этим уже 15 лет... так что было шокирующе и волнующе, когда это наконец сработало".

В исследование были интегрированы большие языковые модели (LLM), в частности GPT-1, предок ChatGPT.

Добровольцы проходили 16-часовые сеансы фМРТ во время прослушивания подкастов. Данные фМРТ были использованы для обучения модели машинного обучения (ML). 

После этого участники слушали или представляли себе новые истории, а ИИ переводил их мозговую активность в текст. Примерно 50% результатов оказались близки или полностью совпали с исходным сообщением. Доктор Хут пояснил: "Наша система работает на уровне идей, семантики, смысла... это суть". 

  • Например, фраза "У меня еще нет водительских прав" расшифровывалась как "Она еще даже не начала учиться водить". 
  • Еще один отрывок: "Я не знала, что делать: кричать, плакать или убегать. Вместо этого я сказал: "Оставьте меня в покое!"" превратилась в "Начал кричать и плакать, а потом она просто сказала: "Я же сказала тебе оставить меня в покое"". 

Модель также была применена к мозговым волнам, генерируемым участниками при просмотре немых фильмов. 

Когда участники слушали определенную историю, интерпретация ИИ отражала общее настроение рассказа. При доработке эта технология может позволить нам писать истории, используя только мысли. 

Не можете начать работу над романом или писательским проектом? Просто прилягте и представьте, как разворачивается сюжет. ИИ напишет его за вас. 

Использование искусственного интеллекта для создания образов на основе мыслей

ИИ может преобразовывать мозговую активность в слова и семантические понятия, а как насчет изображений или музыки? 

A сложный эксперимент Исследователи из Хельсинкского университета (Хельсинки, Финляндия) наблюдали за изображениями лиц, сгенерированными искусственным интеллектом, в то время как их сигналы ЭЭГ записывались. 

После использования этих данных для обучения модели искусственного интеллекта участникам было предложено определить конкретные лица из списка. Эти сигналы, по сути, стали окном в восприятие и намерения участника.

Модель искусственного интеллекта определяла, узнает ли участник то или иное лицо, на основе записанных сигналов ЭЭГ.

На следующем этапе сигналы ЭЭГ использовались для адаптации и формирования генеративной состязательной сети (GAN) - модели, используемой в некоторых генеративных ИИ. 

Это позволило системе создавать новые изображения лиц в соответствии с первоначальным замыслом пользователя. 

Генерация лиц с помощью искусственного интеллекта
В этой задаче по созданию лица "без улыбки" участники просматривали серию лиц. Реакция мозга (показанная здесь в виде графиков) различала релевантные и нерелевантные изображения, направляя компьютер на создание все более точных изображений лиц "без улыбки" в течение нескольких итераций. Источник: Природа.

Как отметил Мишель Спапе, соавтор исследования, "техника не распознает мысли, а скорее реагирует на ассоциации, которые у нас возникают с ментальными категориями".

Проще говоря, если кто-то думает о "пожилом лице", компьютерная система может сгенерировать изображение пожилого человека, которое точно соответствует мыслям участника, и все это благодаря обратной связи с сигналами его мозга.

Рисование с помощью силы мысли

В исследование с аналогичными целямиУченые из Университета Осаки (Япония) впервые разработали методику преобразования сложных сигналов головного мозга в изображения высокого разрешения и добились замечательных результатов.

Метод использует модель Stable Diffusion - специализированную форму нейронной сети, предназначенную для создания изображений. Stable Diffusion была разработана при содействии и финансировании компании Stability AI. 

Мысли фиксируются с помощью фМРТ и передаются в модель стабильной диффузии, которая превращает их в изображения с помощью сложного многоступенчатого процесса, включающего несколько уровней уточнения.

Создание изображений с помощью искусственного интеллекта
Изображения (слева) получены с помощью активности мозга, извлеченной из данных фМРТ, и сформированы в изображения справа. Изображения прошли различные стадии обработки. Источник: Стабильная диффузия при активности мозга.

В отличие от предыдущих исследований, эти методы требовали минимальной настройки модели. Однако при этом участникам все равно приходилось проводить много часов в аппаратах МРТ.

Это ключевая задача, поскольку большинство таких экспериментов предполагает проведение тщательных измерений и обучение моделей, что требует много времени, средств и нелегко переносится участниками.

Однако в будущем не исключено, что люди смогут обучать свои собственные легкие модели чтения мыслей и использовать их в качестве исходных данных для различных целей, например, проектировать здание, думая о нем, или сочинять оркестровую пьесу, придумывая мелодии.

Перевод мыслей в музыку с помощью искусственного интеллекта

Слова, изображения, музыка - ничто не является запретным для ИИ.

A 2023 исследование дает представление о восприятии звука, что открывает широкие возможности для разработки коммуникационных устройств для людей с нарушениями речи.

Роберт Найт и его команда из Калифорнийского университета в Беркли изучили записи мозга с электродов, хирургически установленных на 29 людях с эпилепсией. 

Пока участники слушали песню Pink Floyd "Another Brick in the Wall, Part 1", команда соотносила активность их мозга с такими элементами песни, как высота тона, мелодия, гармония и ритм.

Используя эти данные, исследователи обучили модель искусственного интеллекта, намеренно пропустив 15-секундный фрагмент песни. Затем ИИ попытался предсказать этот пропущенный фрагмент на основе сигналов мозга, добившись сходства спектрограммы 43% с реальным фрагментом песни.

Найт и его команда определили, что область верхней височной извилины мозга необходима для обработки гитарного ритма песни. Они также подтвердили предыдущие выводы о том, что правое полушарие играет более значительную роль в обработке музыки, чем левое.

Найт считает, что более глубокое понимание взаимодействия мозга и музыки может принести пользу устройствам, помогающим людям с нарушениями речи, такими как боковой амиотрофический склероз (БАС) и афазия. 

Он сказал: "Для людей с боковым амиотрофическим склерозом [заболевание нервной системы] или афазией [заболевание языка], которым трудно говорить, мы хотели бы иметь устройство, которое действительно звучало бы так, как будто вы общаетесь с кем-то по-человечески. Понимание того, как мозг представляет музыкальные элементы речи, включая тон и эмоции, может сделать такие устройства менее роботизированными".

Людовик Белье, член исследовательской группы, полагает, что если ИИ сможет воспроизводить музыку на основе простого воображения, это может произвести революцию в музыкальной композиции. 

Музыкальные продюсеры могли бы подключить свой мозг к программному обеспечению и сочинять музыку, используя только мысли, при этом почти не двигаясь.

Следующий шаг: чтение мыслей ИИ в реальном времени

Эти технологии в совокупности относятся к интерфейсам "мозг-компьютер" (brain-computer interfaces, BCI), которые предназначены для преобразования сигналов мозга в определенную форму выходного сигнала. 

BCI уже восстанавливают способность парализованных людей двигаться и ходить, преодолевая разрыв между компонентами нервной системы. 

Среди разработанных в этом году интерфейсов "мозг-компьютер" - устройство, которое позволяет парализованному человеку чтобы пошевелить ногами, экспериментальные мозговые имплантаты которые соединяют поврежденные участки головного и спинного мозга для восстановления утраченных ощущений, и механическая нога, которая Вернул движение ампутанту.

Несмотря на то, что эти первые варианты использования очень перспективны, мы еще далеки от того, чтобы беспрепятственно переводить все нюансы наших мыслей в движения, изображения, речь или музыку. 

Одним из основных ограничений является необходимость в огромных массивах данных для обучения сложных алгоритмов, которые делают возможными такие переводы. 

Чтобы точно предсказать или сгенерировать определенное изображение на основе активности мозга, модели машинного обучения необходимо обучить на множестве сценариев. Для этого необходимо собрать данные МРТ или ЭЭГ, пока участники подвергаются воздействию различных стимулов.

Качество и специфичность получаемых результатов в значительной степени зависят от богатства этих обучающих данных. Участникам необходимо провести несколько часов в МРТ-сканерах, чтобы собрать специфические данные. 

Кроме того, человеческий мозг невероятно уникален. То, что означает счастье в мозгу одного человека, может отличаться от этого в мозгу другого. Это означает, что модели должны быть как общими, так и индивидуально подобранными.

При этом активность мозга меняется быстро, даже в течение долей секунды. Захват данных в реальном времени с высоким разрешением и обеспечение их идеального соответствия внешнему стимулу - сложная техническая задача.

Не стоит забывать и об этических проблемах, связанных с проникновением в мозг человека.

Сбор данных о мозге, особенно в больших масштабах, поднимает серьезные вопросы конфиденциальности и этики. Как обеспечить, чтобы эти данные не использовались не по назначению? Кто имеет право получать доступ к нашим сокровенным мыслям и интерпретировать их?

Предварительно кажется, что эти проблемы могут быть преодолены. В будущем люди смогут получить доступ к портативным интерфейсам "мозг-компьютер", которые позволят им "подключаться" к множеству устройств, облегчающих выполнение сложных действий с помощью силы мысли.

Однако вопрос о том, как общество отнесется к тому, что такая технология станет мейнстримом, остается открытым.

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения