Что такое белок?

Белки - это в основном большие биомолекулы, которые состоят из одной или нескольких длинных цепочек аминокислотных остатков. Белки выполняют широкий спектр функций внутри организмов, в том числе катализируют метаболические реакции, репликацию ДНК, реагируют на стимулы, обеспечивают структуру клеток и организмов и транспортируют молекулы из одного места в другое. Белки отличаются друг от друга в первую очередь своей аминокислотной последовательностью, которая определяется нуклеотидной последовательностью их генов и обычно приводит к сворачиванию белка в определенную трехмерную структуру, которая определяет его активность.

Что такое сворачивание белка?

Сворачивание белка - это физический процесс, с помощью которого белковая цепь транслируется в ее естественную трехмерную структуру, обычно в конформацию «свернутую», благодаря которой белок становится биологически функциональным. Посредством быстрого и воспроизводимого процесса полипептид сворачивается в свою характерную трехмерную структуру из случайного клубка. Каждый белок сначала существует в виде развернутого полипептида или случайной спирали после трансляции из последовательности мРНК в линейную цепочку аминокислот. На этой стадии полипептид лишен какой-либо стабильной (долговечной) трехмерной структуры. Поскольку полипептидная цепь синтезируется рибосомой, линейная цепь начинает складываться в свою трехмерную структуру.

Искусственный интеллект, используемый в исследовательских работах на основе сворачивания белков

  1. Методы улучшения распознавания белковых складок: эмпирическое сравнение (IEEE)

Автор: Яжене Кришнарадж, Чандан К. Редди

Реферат: Распознавание белковой складки - это предсказание третичной структуры белка (складка) с учетом последовательности белка без учета сходства последовательностей. Используя методы машинного обучения для распознавания белковых складок, большинство современных исследований сосредоточено на более традиционных алгоритмах, таких как опорные векторные машины (SVM), k-ближайший сосед (KNN) и нейронные сети (NN). В этой статье мы представляем эмпирическое исследование двух вариантов алгоритмов повышения - AdaBoost и LogitBoost для задачи распознавания свертки. Точность прогноза измеряется на наборе данных с белками из 27 наиболее населенных складок из базы данных SCOP и сравнивается с результатами из другой литературы с использованием алгоритмов SVM, KNN и NN для того же набора данных. В целом, методы бустинга достигают 60% -ной точности распознавания на независимом наборе данных тестового белка, что является самым высоким прогнозом, достигнутым по сравнению со значениями точности, полученными с помощью других методов, предложенных в литературе. Алгоритмы повышения могут очень быстро создавать эффективные модели классификации.

2. Распознавание белковых складок с использованием структурной скрытой марковской модели (IEEE)

Автор: Д. Бухаффра , Ж. Тан

Резюме: На протяжении многих лет распознавание белковой складки было в центре внимания компьютерных биологов. Чтобы сопоставить первичную структуру белка с его правильной трехмерной складкой, мы представляем в этой статье парадигму машинного обучения, которую мы назвали «структурная скрытая марковская модель» (SHMM). Мы показываем, как концепция SHMM может эффективно использовать вторичную структуру белка во время задачи распознавания складок. Результаты экспериментов показали, что SHMM превосходит SVM с улучшением средней точности на 6%. Однако, поскольку в этом приложении два классификатора не коррелированы, их комбинация на основе критерия наивысшего ранга повысила среднюю точность SHMM на 10%.

3. Миметические нейронные сети: унифицированная структура для дизайна и сворачивания белков (arXiv)

Автор: Моше Элиасоф, Ту Боэсен, Эльдад Хабер, Чен Кесар, Эран Трейстер

Аннотация: Последние достижения в области машинного обучения сворачиванию белков позволяют добиться лучших результатов в решении обратной задачи - конструирования белков. В этой работе мы представляем новую нейронную сеть, имитирующую графы, MimNet, и показываем, что можно построить обратимую архитектуру, которая решает проблемы структуры и проектирования в тандеме, что позволяет улучшить дизайн белка, когда структура лучше оценена. Мы используем набор данных ProteinNet и показываем, что современные результаты в дизайне белков могут быть улучшены с учетом последних архитектур для сворачивания белков.

4. DeepFoldit - сворачивающиеся белки нейронной сети с глубоким обучением с подкреплением (arXiv)

Автор: Димитра Н. Пану, Мартин Рецко

Аннотация: Несмотря на значительный прогресс, ab initio предсказание структуры белка остается неоптимальным. Краудсорсинговый подход - это онлайн-игра-головоломка Foldit, которая дала несколько полезных результатов, которые соответствовали или даже превосходили алгоритмически вычисленные решения. Используя Foldit, сотрудники WeFold несколько раз успешно участвовали в Критической оценке методов прогнозирования структуры белка. На основе недавней автономной версии Foldit мы обучили нейронную сеть с глубоким подкреплением под названием DeepFoldit, чтобы улучшить оценку, присвоенную развернутому белку, используя метод Q-обучения с воспроизведением опыта. Эта статья посвящена усовершенствованию модели за счет настройки гиперпараметров. Мы изучили различные реализации, изучив различные архитектуры моделей и изменив значения гиперпараметров для повышения точности модели. Новая модель гиперпараметров также улучшила ее способность к обобщению. Первоначальные результаты последней реализации показывают, что при наличии набора небольших развернутых обучающих белков DeepFoldit изучает последовательности действий, которые улучшают оценку как на обучающем наборе, так и на новых тестовых белках. Наш подход сочетает в себе интуитивно понятный пользовательский интерфейс Foldit с эффективностью глубокого обучения с подкреплением.

5. Машинное обучение сворачиванию и динамике белков (arXiv)

Автор: Франк Ноэ, Джанни де Фабритиис, Сесилия Клементи

Аннотация: Последние достижения в области машинного обучения повлияли на многие аспекты изучения сворачивания и динамики белков. Методы прогнозирования белковых структур по их последовательностям в настоящее время в значительной степени основаны на инструментах машинного обучения. Способ проведения моделирования для изучения энергетического ландшафта белковых систем также меняется, поскольку силовые поля начинают разрабатываться с помощью методов машинного обучения. Эти методы также используются для извлечения важной информации из больших наборов данных моделирования и для улучшения выборки редких событий, таких как переходы сворачивания / разворачивания. Хотя еще предстоит решить серьезные проблемы, мы ожидаем, что эти методы сыграют важную роль в изучении сворачивания и динамики белков в ближайшем будущем. Мы обсуждаем здесь последние достижения на всех этих фронтах и ​​вопросы, которые необходимо решить, чтобы подходы к машинному обучению стали мейнстримом в моделировании белков.

6. DeepDriveMD: Адаптивное молекулярное моделирование на основе глубокого обучения для сворачивания белков (arXiv)

Автор: Хёнгро Ли, Хэн Ма, Маттео Турилли, Дебсиндху Бхоумик, Шантену Джха, Арвинд Раманатан

Резюме: Моделирование биологических макромолекул играет важную роль в понимании физических основ ряда сложных процессов, таких как сворачивание белка. Даже при увеличении вычислительной мощности и развитии специализированных архитектур возможность моделирования сворачивания белков в атомистических масштабах все еще остается сложной задачей. Это проистекает из двойных аспектов высокой размерности белковых конформационных ландшафтов и невозможности моделирования атомистической молекулярной динамики (МД) для получения достаточного количества образцов этих ландшафтов для наблюдения событий складчатости. Методы машинного обучения / глубокого обучения (ML / DL) в сочетании с атомистическими МД-симуляциями дают возможность потенциально преодолеть эти ограничения за счет: (1) эффективного уменьшения размерности МД-симуляций для автоматического построения скрытых представлений, соответствующих биофизически релевантным координатам реакции (RC) и (2) управление моделированием MD для автоматической выборки потенциально новых конформационных состояний на основе этих RC. Мы исследуем, как сочетание подходов DL с моделированием MD может эффективно сворачивать небольшие белки на суперкомпьютерах. В частности, мы изучаем вычислительные затраты и эффективность масштабирования DL-связанных рабочих процессов MD путем сворачивания двух прототипных систем, а именно, Fs-пептида и быстро сворачивающегося варианта белка головной части ворсинки. Мы демонстрируем, что рабочий процесс MD, управляемый DL, может эффективно изучать скрытые представления и управлять адаптивным моделированием. По сравнению с традиционными подходами, основанными на MD, наш подход обеспечивает эффективный прирост производительности при выборке свернутых состояний как минимум в 2,3 раза. Наше исследование обеспечивает количественную основу для понимания того, как моделирование MD на основе DL может привести к эффективному увеличению производительности и сокращению времени на решение на суперкомпьютерных ресурсах.

7. Сворачивание мембранных белков за счет глубокого трансферного обучения (arXiv)

Автор: Шэн Ван, Чжэнь Ли, Ичжоу Юй, Цзиньбо Сюй

Резюме: Вычислительное выяснение структур мембранных белков (MP) является сложной задачей, частично из-за отсутствия достаточного количества решенных структур для моделирования гомологии. Здесь мы описываем высокопроизводительный метод обучения с глубоким переносом, который сначала предсказывает контакты MP путем обучения на немембранных белках (не-MP), а затем предсказывает модели трехмерной структуры с использованием предсказанных контактов в качестве ограничения расстояния. Протестированный на 510 неизбыточных MP, наш метод имеет точность прогнозирования контакта как минимум на 0,18 выше, чем существующие методы, предсказывает правильные складки для 218 MP (TMscore не менее 0,6) и генерирует трехмерные модели со среднеквадратичным отклонением менее 4 и 5 ангстрем. на 57 и 108 депутатов соответственно. Строгий слепой тест в проекте непрерывной автоматической оценки моделей (CAMEO) показывает, что наш метод предсказал трехмерные модели с высоким разрешением для двух недавних тестовых MP из 210 остатков с RMSD, близким к 2 Angstrom. Мы подсчитали, что наш метод может предсказать правильные складки для от 1345 до 1871 изученных многопроходных МП человека, включая несколько сотен новых складок, что должно облегчить открытие лекарств, нацеленных на мембранные белки.

Вывод

В этой статье мы исследовали тему сворачивания белков и то, как идеи искусственного интеллекта могут быть использованы для внедрения инноваций и прогресса в сворачивании белков. Я надеюсь, что читатели хорошо проведут время, исследуя эту область после прочтения этой статьи. Я бы порекомендовал читателям, которые хотят узнать больше об ИИ в сворачивании белков, посетить https://deepmind.com/research/case-studies/alphafold. :)

Присоединяйтесь к FAUN: Веб-сайт 💻 | Подкаст 🎙️ | Twitter 🐦 | Facebook 👥 | Instagram 📷 | Группа Facebook 🗣️ | Группа Linkedin 💬 | Slack 📱 | Cloud Native Новости 📰 | Еще .

Если этот пост был полезен, нажмите несколько раз кнопку хлопка 👏 ниже, чтобы выразить поддержку автору 👇