ЖИВОЕ

Как сворачивается белок и почему именно эту задачу покорил ИИ

Полвека биологи бились над вопросом, какую форму примет белок из известной цепочки аминокислот. Перебрать все варианты невозможно за время жизни Вселенной. А потом пришёл ИИ и почти решил задачу. Разбираем, как.

Зная буквы цепочки, мы десятилетиями не могли предсказать форму белка — пока за дело не взялась нейросеть.
Функция белка определяется его трёхмерной формой. А форма задаётся последовательностью аминокислот. Связать одно с другим — одна из главных загадок биологии XX века.

Белок рождается как длинная цепочка-ниточка, но мгновенно сворачивается в сложный трёхмерный клубок строго определённой формы. И именно форма решает всё: фермент работает как ключ к замку, антитело цепляет вирус. Вопрос на миллион: можно ли по последовательности букв предсказать итоговую форму, не выращивая белок в лаборатории?

Почему это так трудно

Казалось бы — переберём все возможные складки и выберем самую устойчивую. Но вариантов столько, что перебор невозможен в принципе. Эту мысль ещё в 1969 году сформулировал биолог Сайрус Левинталь: если бы белок перебирал все формы по очереди, на это ушло бы времени больше, чем существует Вселенная. А реальный белок сворачивается за миллисекунды.

Вывод: природа не перебирает — она «скатывается» к нужной форме по законам физики, как шарик в самую глубокую ямку рельефа. Проблема в том, что этот рельеф безумно сложен, и посчитать его напрямую для большого белка долгое время было непосильно даже суперкомпьютерам.

Как задачу решали раньше

Форму белка определяли экспериментально — методами вроде рентгеновского анализа кристаллов. Это точно, но медленно и дорого: одна структура могла стоить годы работы. К началу 2020-х структуры были известны лишь для малой доли всех белков. А вот последовательностей накопились миллионы — спасибо дешёвому секвенированию. Возник разрыв: букв много, форм мало.

Что сделал ИИ

Учиться на примерах вместо перебора

Прорыв совершила система AlphaFold. Вместо того чтобы моделировать физику сворачивания, нейросеть обучили на тысячах уже известных пар «последовательность → форма». Она нашла глубокие закономерности: какие сочетания аминокислот, как правило, оказываются рядом в пространстве. По сути, она научилась угадывать ответ по аналогии, а не выводить его с нуля.

Подсказка из эволюции

Хитрый трюк — использовать родственные белки разных видов. Если в двух далёких организмах две позиции в цепочке мутируют согласованно, скорее всего, в пространстве они соприкасаются и «держат» друг друга. Эволюция, сама того не зная, оставила подсказки о трёхмерной структуре — модель научилась их читать.

Стоит уточнить: AlphaFold не «понимает» физику сворачивания так, как биолог. Она статистически предсказывает наиболее правдоподобную форму, опираясь на колоссальный массив примеров. Это и сила, и ограничение: для белков, похожих на уже изученные, предсказания удивительно точны, а для совсем непривычных последовательностей или хитрых случаев модель может ошибиться. Поэтому её прогнозы — мощная отправная точка, которую при необходимости всё равно проверяют экспериментом.

Почему это огромное событие

  • Скорость. То, что занимало годы эксперимента, теперь считается за часы.
  • Масштаб. Предсказаны структуры почти всех известных белков — сотни миллионов.
  • Лекарства. Зная форму белка-мишени, проще придумать молекулу, которая к нему подойдёт.

Главный урок

История сворачивания белка — образцовый пример, где ИИ обошёл лобовой расчёт. Задачу нельзя было решить перебором и трудно — честной физикой. Но её удалось решить обучением на данных: накопились миллионы примеров, и нейросеть выловила в них структуру, недоступную человеку. Это та же логика, что стоит за распознаванием изображений, только вместо «кошка или собака» ответ — трёхмерная карта молекулы жизни.

#AlphaFold#белок#биология#ИИ#сворачивание