ИИ-модель имитирует 500 миллионов лет эволюции для создания нового флуоресцентного белка

19 июля 2024 года

  • Исследователи создали модель искусственного интеллекта для создания совершенно новых, функциональных белков
  • Белок, никогда ранее не встречавшийся в природе, повторяет белок, используемый в биолюминесценции
  • Этот процесс, по сути, обходит миллионы лет эволюции белков
Ай протеин

Ученые разработали систему искусственного интеллекта, способную моделировать сотни миллионов лет эволюции белков, создав новый флуоресцентный белок, не похожий ни на один из существующих в природе.

Исследовательская группа под руководством Александра Ривеса из EvolutionaryScale создала большую языковую модель (LLM) под названием ESM3 для обработки и генерации информации о белковых последовательностях, структурах и функциях. 

Обучаясь на данных о миллиардах природных белков, ESM3 научился предсказывать, как белки могут эволюционировать и изменяться с течением времени.

Исследователи утверждают, что ESM3 - это не просто поиск или рекомбинация существующей информации о белках. 

Вместо этого, судя по всему, она достигла понимания фундаментальных принципов, определяющих структуру и функционирование белков, что позволяет ей создавать действительно новые конструкции.

"ESM3 - это эмерджентный симулятор, который был выучен в результате решения задачи предсказания жетонов на данных, полученных в ходе эволюции", - объясняют исследователи в своей работе. исследование.

"Существует теория, что нейронные сети обнаруживают глубинную структуру данных, которые они обучены предсказывать. Таким образом, решение задачи предсказания токенов потребует от модели изучения глубинной структуры, определяющей шаги эволюции, то есть фундаментальной биологии белков".

Для проверки модели команда ESM3 попросила разработать совершенно новый зеленый флуоресцентный белок (GFP) - тип белка, отвечающий за биолюминесценцию некоторых морских животных и широко используемый в биотехнологических исследованиях.

Созданный ИИ белок, получивший название esmGFP, имеет всего 58% общей последовательности с наиболее похожими известными флуоресцентными белками.

Примечательно, что esmGFP обладает яркостью, сравнимой с естественными GFP, и сохраняет характерную бочкообразную структуру, необходимую для флуоресценции. 

По оценкам исследователей, для создания белка, столь далекого от известных GFP, потребовалось бы более 500 миллионов лет естественной эволюции.

Подробнее об исследовании

Процесс создания esmGFP включает в себя несколько ключевых этапов:

  1. Данные: Исследователи обучили ESM3 примерно на 2,78 миллиардах природных белков, собранных из баз данных последовательностей и структур. Сюда вошли данные из UniRef, MGnify, JGI и других источников.
  2. Архитектура: ESM3 использует архитектуру на основе трансформаторов с некоторыми модификациями, включая механизм "геометрического внимания" для обработки трехмерных структур белков.
  3. Подсказка: Исследователи предоставили ESM3 минимальную структурную информацию из шаблона GFP (флуоресцентного белка).
  4. Поколение: ESM3 использовал эту подсказку для создания новых белковых последовательностей и структур с помощью итеративного процесса.
  5. Фильтрация: Тысячи проектов-кандидатов были подвергнуты вычислительной оценке и отфильтрованы для выявления наиболее сильных кандидатов.
  6. Экспериментальное тестирование: Наиболее перспективные конструкции были синтезированы и протестированы в лаборатории на флуоресцентную активность.
  7. Усовершенствование: Определив тусклый, но далекий вариант GFP, исследователи использовали ESM3 для дальнейшей оптимизации конструкции, в итоге получив более яркий флуоресцентный белок.

Последствия этого исследования выходят за рамки создания одного нового белка. 

ESM3 демонстрирует способность исследовать пространства дизайна белков, далекие от тех, что были созданы естественной эволюцией, открывая новые возможности для создания белков с желаемыми функциями или свойствами.

Доктор Тиффани Тейлор, профессор микробной экологии и эволюции в Университете Бата, не принимавший участия в исследовании, рассказал LiveScience: "Сейчас нам все еще не хватает фундаментального понимания того, как белки, особенно "новые для науки", ведут себя при внедрении в живую систему, но это новый крутой шаг, который позволяет нам по-новому подойти к синтетической биологии".

"ИИ-моделирование, подобное ESM3, позволит открывать новые белки, которые никогда бы не позволили ограничения естественного отбора, создавая инновации в белковой инженерии, которые не под силу эволюции", - добавил доктор Тейлор.

Генеративный дизайн белков

Исследования и разработка белков на основе искусственного интеллекта достигли лихорадочного уровня, и DeepMindAlphaFold 3 с невероятной точностью предсказывают, как складываются белки. 

Белки, разработанные на основе ИИ, также показали отличная прочность скрепленияЭто показывает, что у них есть практическое применение. 

Однако, как и в случае с любой быстро развивающейся технологией, которая так или иначе взаимодействует с биологией, здесь есть свои риски. 

Во-первых, если разработанные ИИ белки попадут в окружающую среду, они потенциально могут взаимодействовать с природными экосистемами, даже конкурировать с природными белками или нарушать существующие биологические процессы. 

Во-вторых, они могут вызывать неожиданные взаимодействия внутри живых организмов, потенциально даже создавать вредные биологические агенты или токсины. 

Исследователи недавно призвали этические принципы для разработки ИИ-белков, чтобы предотвратить рискованные результаты в этой захватывающей, хотя и непредсказуемой области. 

Присоединяйтесь к будущему


ПОДПИСАТЬСЯ СЕГОДНЯ

Четко, лаконично, всесторонне. Получите представление о развитии искусственного интеллекта с помощью DailyAI

Сэм Джинс

Сэм - писатель в области науки и техники, работавший в различных AI-стартапах. Когда он не пишет, его можно найти за чтением медицинских журналов или копанием в коробках с виниловыми пластинками.

×

ЭКСКЛЮЗИВНЫЙ БЕСПЛАТНЫЙ PDF
Будьте впереди с DailyAI

Подпишитесь на нашу еженедельную рассылку и получите эксклюзивный доступ к последней электронной книге DailyAI: "Освоение инструментов искусственного интеллекта: Ваше руководство по повышению производительности в 2024 году".

* Подписываясь на нашу рассылку, вы принимаете наши Политика конфиденциальности и наш Условия и положения