5

Как и зачем?

Группа исследователей из Колумбийского университета, MIT и Гарварда с помощью связки научных ИИ переписали часть рибосомы кишечной палочки так, чтобы она обходилась без одной из 20 аминокислот — изолейцина. 20 аминокислот – это "строительный стандарт" современной биологии. И теперь ученые пусть и не создали микроба, полностью работающего на 19 аминокислотах (помимо переписанных рибосомных белков в геноме остаются еще тысячи других, где изолейцин на месте), но сделали большой шаг в этом направлении.

И здесь, прямо как в известном меме, два вопроса: как и зачем?

Как и зачем?


Начнем с как. Мы воспринимаем нейросети как инструменты для создания текста, кода и картинок, но похожие методы используются и в науке. Последовательность аминокислот в белке записывается текстом (например, A-цепь инсулина выглядит так: GIVEQCCTSICSLYQLENYCN) – значит, на известных последовательностях можно обучить аналог языковой модели и генерировать новые варианты под нужную задачу..

Но последовательность букв — это не работающий белок. Белок рождается как цепочка аминокислот, а затем сворачивается в трехмерную структуру. Предсказание этих структур долго было одним из главных вызовов в биологии — на один белок уходили месяцы и огромные деньги. В DeepMind решили эту проблему, обучив AlphaFold 2 на известных последовательностях и формах – и вскоре открыли базу предсказанных структур для более чем 200 миллионов белков, то есть практически всех известных науке.


Для создания белка сейчас обычно используют связку из трех ИИ. RFdiffusion получает задачу – например, придумать белок, который связывается с молекулой вируса – и генерирует трехмерную структуру похожим образом как графические ИИ рисуют картинку. Затем структура передается в ProteinMPNN, которая подбирает под нее последовательность аминокислот. А на финальном этапе AlphaFold 2 проверяет, в правильную ли форму сворачивается последовательность. Если нет – задача отправляется на переделку.

В нашей истории форму белков не нужно было придумывать с нуля — рибосома существует четыре миллиарда лет, ее устройство известно. Задача была другая: подобрать новую последовательность под уже известную форму, обходясь без изолейцина. Поэтому в работе использовались только ProteinMPNN и AlphaFold — плюс ещё пара языковых моделей, родственных идеям Бейкера.

Теперь к вопросу зачем. Белки нужны в самых разных областях. В медицине это новые лекарства – от суперантибиотиков до препаратов против рака. В промышленности – например, более эффективные моющие средства или ферменты для переработки пластика. И есть третья причина, самая интересная: проверять гипотезы о том, как устроена жизнь.

Все известные организмы – от бактерии до человека – пользуются одним и тем же набором из 20 аминокислот. Это одно из самых сильных свидетельств того, что вся жизнь произошла от общего предка. Но есть давнее подозрение, что до этого общего предка набор был короче. Часть аминокислот легко появляется в неорганических условиях — а часть, включая изолейцин, требует сложного многоступенчатого синтеза в клетке и, скорее всего, появилась позже.

Единственный способ узнать, возможна ли жизнь с укороченным алфавитом – попробовать построить такую жизнь и посмотреть. Но для этого надо одновременно переписать множество белков, что было нереально без ИИ.
Получившийся в эксперименте штамм Ec19 – это еще не настоящая 19-аминокислотная бактерия, но это первый шаг в ту сторону за всю историю биологии. И возможно – первый шаг к пониманию того, как выглядела жизнь до того, как обрела свой нынешний алфавит.

А отдельно интересно в истории то, что некоторые правки, предложенные ИИ, оказались неожиданными для ученых. “Возможно, эти модели знают аспекты биологии, которые мы можем подтвердить экспериментально, но пока не понимаем”, — сказал один из исследователей.

Кстати, работать с ИИ я учу в подписке на “Бусти”. Новые белки мы пока не открываем, но вот правильный промптинг и развертывание ИИ-агентов уже прошли!

Так что самое время подписаться.

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества