Революция в вычислительной биологии
Тут что-то важное произошло для всей медицины. Исследователи Вашингтонского университета разработали нейронную сеть RoseTTAFold, которая может вычислять белковые структуры за 10 минут.
RoseTTAFold - это трёхмерная нейронная сеть, что означает, что она одновременно учитывает закономерности в последовательностях белков, то, как аминокислоты белка взаимодействуют друг с другом и возможную трехмерную структуру белка.
К слову, белки состоят из цепочек аминокислот, которые складываются в сложные микроскопические формы. Эти уникальные формы, в свою очередь, вызывают почти все химические процессы внутри живых организмов. Лучше понимая формы белков, ученые могут ускорить разработку новых методов лечения рака, COVID-19 и тысяч других заболеваний.
В прошлом году команда DeepMind уже представила подобный алгоритм AlphaFold2, но на обработку запроса требовалось несколько дней и сама "начинка" алгоритма была засекречена, а новый метод работает в несколько раз быстрее и главное открыт для научной общественности на github.
Также любому желающему вычислить структуру белка, доступен веб сайт:
Вычисляющий по алгоритму RoseTTAFold
Все белки состоят из комбинации 20 аминокислот.
Их обозначения ACDEFGHIKLMNPQRSTVWY
Например белок мышц состоит из 15 тысяч аминокислот
( комбинаций тех самых 20 аминокислот )
Большая проблема в современной биоинженерии – белок, если точнее, процесс его сворачивания. Любая молекула белка состоит из альфа-аминокислот, соединенных в цепочку. После цепочка сворачивается в более сложную трехмерную молекула – биологически активный белок. А в зависимости от формы сворачивания, определяется функция этих белков в клетках. Но именно этот процесс крайне сложно предсказать, так как он зависит от множества факторов, а сама цепочка может свернуться не один, а два и три раза.
До недавнего времени было достаточно сложно предсказать какая молекула белка получится из заданного набора аминокислот. Но вот 15 июля лондонская DeepMind опубликовала (https://github.com/deepmind/alphafold) на GitHub исходный код своей нейронки AlphaFold 2, которая с точностью более 90% предсказывает исходную структуру молекулы белка, пишет (https://www.nature.com/articles/d41586-021-01968-y#ref-CR2) Nature.
Одновременно с этим, журнал Science опубликовал
(https://science.sciencemag.org/content/early/2021/07/14/scie...) статью о том, что ученые из США, Канады и Европы предоставили в открытый доступ свою нейросеть RoseTTaFold, работающую почти так же хорошо, как и AlphaFold 2, но потребляющая гораздо меньше ресурсов – 8 ГБ видеопамяти на каждый графический процессор вместо 24 ГБ у AlphaFold 2.
Вообще, интересно наблюдать за конкуренцией на поле биоинженерии. Еще 1 декабря DeepMind провела краткую презентацию AlphaFold 2 на CASP, но мало что о ней сказали. После чего Дэвид Бэйкер, глава разработки RoseTTaFold сказал: “Если кто-то решил проблему, над которой вы работаете, но не раскрывает, как он это сделал, как вы продолжить работу над ней?” Еще раз убеждаюсь, что конкуренция – лучший мотиватор.
Проблема точности предсказания 3D-структуры белка заключается в сложности создания новых лекарств и лечения заболеваний, таких как, например, болезнь Альцгеймера, в развитии которой во многом виноваты неправильно свернутые белки.
На протяжении десятилетий ученые использовали трудоемкие и дорогие методы, такие как рентгеновская кристаллография и криоэлектронная микроскопия для определения структуры белков. А некоторые структуры и вовсе не поддавались такому анализу.
Теперь благодаря исходному коду, даже крупные компании могут использовать нейросети 🤖🧬 для задач, которые еще недавно казались невыполнимыми.