Новый метод показывает множество возможных конформаций, которые может принять белок.

Криоэлектронная микроскопия (крио-ЭМ) позволяет ученым получать трехмерные изображения крошечных молекул, таких как белки, с высоким разрешением. Этот метод лучше всего работает для визуализации белков, которые существуют только в одной конформации, но исследователи MIT теперь разработали алгоритм машинного обучения, который помогает им идентифицировать несколько возможных структур, которые может принимать белок.

В отличие от методов искусственного интеллекта, которые нацелены на предсказание структуры белка только на основе данных последовательности, здесь структуру белка можно экспериментально определить с помощью крио-ЭМ, которая производит сотни тысяч или даже миллионы двухмерных изображений образцов белка, замороженных в тонком слое льда. Затем компьютерные алгоритмы объединяют эти изображения, снятые под разными углами, в трехмерное изображение белка в процессе, называемом реконструкцией.

В статье Nature Methods исследователи Массачусетского технологического института сообщают о новом программном обеспечении на основе искусственного интеллекта для реконструкции множественных структур и движений изображенного белка — одной из главных целей исследований научного сообщества. Вместо того чтобы использовать традиционное представление структуры белка в виде интенсивности рассеяния электронов на трехмерной решетке, что непрактично для моделирования множественных структур, разработчики ввели новую архитектуру нейронной сети, которая может эффективно генерировать полный ансамбль структур в одной модели.

“Благодаря широкой репрезентативной способности нейронных сетей мы можем извлекать структурную информацию из «зашумленных» изображений и визуализировать детальные движения макромолекулярных машин», — говорит Эллен Чжун, аспирантка Массачусетского технологического института и ведущий автор статьи.

С помощью своего программного обеспечения ученые спрогнозировали движение белков из наборов данных изображений, где первоначально была идентифицирована только одна статическая трехмерная структура. Они также визуализировали крупномасштабные гибкие движения сплайсосомы — белкового комплекса, который координирует сплайсинг белковых кодирующих последовательностей транскрибируемой РНК.

“Наша идея состояла в том, чтобы, используя методы машинного обучения, лучше уловить лежащую в основе структурную гетерогенность и исследовать разнообразие структурных состояний, присутствующих в образце”, — говорит Джозеф Дэвис, доцент кафедры биологии Массачусетского технологического института.

Дэвис и Бонни Бергер, профессор математики Массачусетского технологического института и руководитель группы вычислений и биологии в Лаборатории компьютерных наук и искусственного интеллекта, являются старшими авторами исследования, которое сегодня публикуется в журнале Nature Methods. Сотрудник Массачусетского технологического института Тристан Беплер также является соавтором этой статьи.

Визуализация многоступенчатого процесса

Исследователи продемонстрировали полезность своего нового подхода, проанализировав структуры, которые образуются в процессе сборки рибосом — клеточных органелл, ответственных за считывание мессенджерной РНК и перевод ее в белки. Дэвис начал изучать структуру рибосом в Исследовательском институте Скриппса. Рибосомы имеют две основные субъединицы, каждая из которых содержит множество отдельных белков, собранных в многоступенчатом процессе.

Чтобы детально изучить этапы сборки рибосом, Дэвис остановил процесс в разных точках, а затем сделал снимки полученных структур под электронным микроскопом. В некоторых точках блокирующая сборка приводила к накоплению только одной структуры, предполагая, что существует только один способ для этого шага. Однако блокирование других точек привело к появлению множества различных структур, предполагающих, что сборка может происходить различными способами.

Поскольку некоторые из этих экспериментов генерировали очень много различных белковых структур, традиционные инструменты реконструкции криоэмиссии не могли точно определить, что это были за структуры.

“В общем, это чрезвычайно сложная задача — попытаться выяснить, сколько состояний у вас есть, когда у вас есть смесь частиц”, — говорит Дэвис.

После запуска своей лаборатории в Массачусетском технологическом институте в 2017 году он объединился с Бергером, чтобы использовать машинное обучение для разработки модели, которая может использовать двумерные изображения, полученные крио-ЭМ, для генерации всех трехмерных структур, найденных в исходном образце.

Для Nature Methods исследователи продемонстрировали силу этого метода, используя его для идентификации нового состояния рибосомы, которое раньше не наблюдалось. Предыдущие исследования показали, что по мере сборки рибосомы сначала формируются крупные структурные элементы — сродни фундаменту здания. Только после того, как эта основа сформирована, в структуру добавляются “активные участки” рибосомы, которые считывают РНК и синтезируют белки.

Однако в новом исследовании ученые обнаружили, что в очень небольшом подмножестве рибосом, около 1 процента, структура, которая обычно добавляется в конце, фактически появляется до сборки основы. Чтобы объяснить это, Дэвис выдвигает гипотезу, что для клеток может оказаться слишком энергетически дорогостоящим гарантировать, что каждая отдельная рибосома собрана в правильном порядке.

“Клетки, вероятно, эволюционировали, чтобы найти баланс между тем, что они могут терпеть (возможно, небольшой процент этих структур потенциально вреден), и затратами на то, чтобы полностью удалить их из пути сборки”, — говорит он.

Аспирантка Эллен Чжун показывает, как ее команда сочетает криоэлектронную микроскопию и машинное обучение для визуализации молекул в 3D

Вирусные белки

В настоящее время исследователи используют этот метод для изучения шиповидного белка Спайка в коронавирусах, который связывается с рецепторами на клетках человека и позволяет им проникать в клетки. Рецепторсвязывающий домен (RBD) шиповидного белка имеет три субъединицы, каждая из которых может указывать либо вверх, либо вниз.

“Для меня наблюдение за пандемией, развернувшейся в прошлом году, подчеркнуло, насколько важными будут передовые препараты в борьбе с подобными вирусами, которые, вероятно, появятся в будущем. Когда мы начинаем думать о том, как можно было бы разработать небольшие молекулы соединений, чтобы заставить все RBDs перейти в состояние «вниз», так, что они не смогут взаимодействовать с человеческими клетками, приходит понимание того, что такое состояние «вверх» и насколько информативным будет изучение конформационной гибкости для создания лекарств. Мы надеемся, что наша новая техника сможет выявить такого рода структурные детали”, — говорит Дэвис.

Исследование финансировалось программой стипендий для аспирантов Национального научного фонда, Национальными институтами здравоохранения и клиникой машинного обучения и здоровья MIT Jameel Clinic for Machine Learning and Health. Эта работа была поддержана вычислительным кластером MIT Satori, размещенным в MGHPCC.

Источник: https://news.mit.edu/2021/machine-learning-model-helps-determine-protein-structures-0204

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *