Одна из причин, по которой так сложно создать эффективные вакцины против некоторых вирусов, включая грипп и ВИЧ, заключается в том, что эти вирусы очень быстро мутируют. Это позволяет им уклоняться от антител, генерируемых конкретной вакциной, с помощью процесса, известного как «уклонение вируса».
Исследователи Массачусетского технологического института разработали новый способ компьютерного моделирования утечки вирусов, основанный на моделях, которые изначально были разработаны для анализа языка. Модель может предсказать, какие участки вирусных поверхностных белков с большей вероятностью будут мутировать таким образом, чтобы вирус ускользнул, а также может идентифицировать участки, которые с меньшей вероятностью мутируют, что делает их хорошими мишенями для новых вакцин.
«Уклонение вируса — большая проблема, — говорит Бонни Бергер (Bonnie Berger), профессор математики Саймонса и руководитель группы вычислений и биологии в лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института. — Уклонение вируса поверхностного белка гриппа и поверхностного белка оболочки ВИЧ в высшей степени ответственно за тот факт, что у нас нет универсальной вакцины против гриппа, и у нас нет вакцины против ВИЧ, которые вызывают сотни тысяч смертей в год».
В исследовании, опубликованном сегодня в журнале Science, Бергер и её коллеги определили возможные мишени для вакцин против гриппа, ВИЧ и SARS-CoV-2. С тех пор, как эта статья была принята к публикации, исследователи также применили свою модель к новым вариантам SARS-CoV-2, недавно появившимся в Великобритании и Южной Африке. По словам исследователей, этот анализ, который ещё не прошёл рецензирование, выявил вирусные генетические последовательности, которые следует дополнительно изучить на предмет их способности избежать применения существующих вакцин.
Бергер и Брайан Брайсон (Bryan Bryson), доцент кафедры биологической инженерии Массачусетского технологического института и член Института Рагона при MGH, MIT и Гарварде, являются соавторами статьи, а ведущим автором стал аспирант MIT Брайан Хи (Brian Hie).
Язык белков
Различные типы вирусов приобретают генетические мутации с разной скоростью, и ВИЧ и грипп относятся к числу тех, которые мутируют быстрее всего. Чтобы эти мутации способствовали ускользанию вируса, они должны помочь ему изменить форму поверхностных белков, чтобы антитела больше не могли связываться с ними. Однако белок не может измениться таким образом, чтобы он стал нефункциональным.
Команда MIT решила смоделировать эти критерии с помощью вычислительной модели, известной как языковая модель, из области обработки естественного языка (NLP). Эти модели изначально были разработаны для анализа языковых закономерностей, в частности, частоты встречаемости определённых слов вместе. Затем модели могут предсказывать, какие слова можно использовать для завершения предложения — например, такого как «Салли съела яйца на …» Выбранное слово должно быть грамматически правильным и иметь правильное значение. В этом примере модель NLP может предсказывать «завтрак» или «обед».
Ключевой вывод исследователей заключался в том, что такую модель можно также применять к биологической информации, такой как генетические последовательности. В этом случае грамматика аналогична правилам, определяющим, является ли белок, кодируемый определенной последовательностью, функциональным или нет, а семантическое значение аналогично тому, может ли белок принимать новую форму, которая помогает ему уклоняться от антител. Следовательно, мутация, позволяющая ускользнуть от вируса, должна поддерживать грамматичность последовательности, но при этом изменять структуру белка полезным образом.
«Вирус хочет ускользнуть от иммунной системы человека, но не мутировать так, чтобы умереть или не воспроизводиться, — говорит Хи. — Он хочет сохранить физическую форму, но достаточно замаскироваться, чтобы его не обнаружила иммунная система».
Чтобы смоделировать этот процесс, исследователи обучили модель NLP анализу паттернов, обнаруженных в генетических последовательностях, что позволяет ей предсказывать новые последовательности, которые имеют новые функции, но при этом следуют биологическим правилам структуры белка. Одним из значительных преимуществ такого моделирования является то, что для него требуется только информация о последовательности, которую гораздо проще получить, чем о структурах белков. Модель может быть обучена на относительно небольшом объёме информации — в этом исследовании исследователи использовали 60 000 последовательностей ВИЧ, 45 000 последовательностей вируса гриппа и 4000 последовательностей коронавируса.
«Языковые модели очень эффективны, потому что они могут изучить эту сложную распределительную структуру и получить некоторое представление о функциях только на основе изменения последовательности, — говорит Хи. — У нас есть большой корпус данных о вирусных последовательностях для каждой позиции аминокислоты, и модель изучает эти свойства совместной встречаемости и совместной вариации аминокислот в обучающих данных».
Предотвращение уклонения
После обучения модели исследователи использовали её для прогнозирования последовательностей шипованного белка коронавируса, белка оболочки ВИЧ и белка гемагглютинина (HA) гриппа, которые с большей или меньшей вероятностью будут генерировать ускользающие мутации.
Для гриппа модель показала, что последовательности, которые с наименьшей вероятностью мутируют и вызывают ускользание вируса, находятся в основе белка HA. Это согласуется с недавними исследованиями, показывающими, что антитела, нацеленные на стебель HA (которые не развиваются у большинства людей, инфицированных гриппом или вакцинированных против него), могут обеспечить почти универсальную защиту от любого штамма гриппа.
Анализ модели коронавирусов показал, что часть белка-шипа, называемого субъединицей S2, с наименьшей вероятностью генерирует мутации ускользания. По-прежнему остается вопрос, насколько быстро вирус SARS-CoV-2 мутирует, поэтому неизвестно, как долго вакцины, применяемые в настоящее время для борьбы с пандемией Covid-19, будут оставаться эффективными. Первоначальные данные свидетельствуют о том, что вирус не мутирует так быстро, как грипп или ВИЧ. Однако исследователи недавно выявили новые мутации, появившиеся в Сингапуре, Южной Африке и Малайзии, которые, по их мнению, должны быть исследованы на предмет потенциального ускользания вируса (эти новые данные ещё не прошли экспертную оценку).
В своих исследованиях ВИЧ ученые обнаружили, что гипервариабельная область белка V1-V2 имеет множество возможных ускользающих мутаций, что согласуется с предыдущими выводами, и они также нашли последовательности, у которых была бы более низкая вероятность ускользания.
В настоящее время исследователи работают с другими, чтобы использовать свою модель для определения возможных мишеней для противораковых вакцин, которые стимулируют собственную иммунную систему организма на уничтожение опухолей. Они говорят, что ее также можно использовать для разработки низкомолекулярных препаратов, которые с меньшей вероятностью будут вызывать резистентность к таким заболеваниям, как туберкулез.
«Существует так много возможностей, и всё, что нам нужно — это данные о последовательности, которые легко производить», — говорит Брайсон.
Исследование финансировалось стипендией для аспирантов по науке и технике национальной обороны Министерства обороны и стипендиями для аспирантов Национального научного фонда.
Источник: https://news.mit.edu/2021/model-viruses-escape-immune-0114