AlphaGo научился играть в го на уровне гроссмейстера. AlphaFold использовала аналогичные методы, чтобы научиться предсказывать сворачивание белков, и это гораздо важнее.
Сворачивание белков — это странная проблема. Все дело в том, что ДНК устанавливает последовательность аминокислот, которые должны быть соединены вместе, чтобы построить белок, но она определяет только их порядок. После того, как белковая цепь сформирована, она превращается в трехмерную форму — немного похоже на прямой кусок проволоки, который ранее был согнут в форму, которую он «запоминает». То, как белок сворачивается для создания трехмерной формы, сложным образом определяется притяжением между различными аминокислотами. Белок скручивается в пространстве, сближая сильно притягивающие аминокислоты, сводя к минимуму локальный изгиб структуры.
Если у вас есть последовательность аминокислот, как, например, считывание последовательности ДНК, то это дает вам химическую формулу белка, но не всю его важную трехмерную форму. Разработка его трехмерной формы — это проблема сворачивания белка, и это очень сложно. Вы, наверное, догадались, что у решения проблемы сворачивания белка есть множество реальных приложений, и мы действительно хотим решить, как это сделать.
Обычные процедуры оптимизации слишком медленны, и именно здесь на помощь приходят нейронные сети. DeepMind участвовал в соревновании по предсказанию сворачивания белков с нейронной сетью AlphaFold. Он занял первое место и был намного лучше своего ближайшего соперника.
Он совершил подвиг в несколько этапов. Первое кажется маловероятным достижением — нейронная сеть научилась предсказывать такие свойства, как расстояния между парами аминокислот и углы между связями, исходя только из последовательности ДНК. Кажется маловероятным, что вы можете предсказать такие вещи, используя только линейную аминокислотную последовательность. но похоже можно.
После того, как физические свойства были определены, фрагменты данных известной структуры белка были подогнаны, чтобы дать трехмерную форму, которая давала те же свойства. Генеративная нейронная сеть также была обучена генерировать новые фрагменты белка, которые также использовались для улучшения формы.
Второй метод попытался сложить всю цепочку, чтобы она соответствовала прогнозам расстояния и угла, используя оптимизацию — см. Анимацию ниже. Для изгиба цепи в соответствии с предсказанными физическими свойствами использовался простой градиентный спуск. Если вы посмотрите внимательно, то увидите, что начальное складывание происходит довольно быстро, а затем градиентный спуск медленно «возится» с точной регулировкой для улучшения посадки.
Анимация метода градиентного спуска для прогнозирования структуры свернутого белка.
Это не очевидное применение ИИ, но это то, что может стать революционным во многих областях в будущем. ИИ дает нам возможность решать проблемы новыми способами — единственная проблема в том, что мы не знаем, насколько доверять результатам, поскольку прогнозы ИИ редко содержат границы ошибок. Также кажется, что другие участники и наблюдатели были немного шокированы тем, что команда ИИ могла «разбить ворота» их группы и взять на себя область исследования, ничего не зная об этом. Это, вероятно, будет происходить все чаще в ведущей науке об ИИ.