АльфаФолд и сходным программам еще многому надо обучиться

Nov 11, 2024 04:35


АльфаФолд это программный инструмент, в основе которого лежит нейросеть, обученная на огромном массиве данных о 3-D структуре белков, собранных в PDB (Protein Data Bank). Собственно, наличие PDB как общедоступной базы данных, явилось важным, если не решающим, фактором, обеспечившим «победный рывок» АльфаФолд 2 в решении проблемы предсказания 3-D структуре белков по их первичной структуре т.е. последовательности аминокислот (подробнее: https://prof-afv.livejournal.com/87693.html ). Это достижение разработчиков АльфаФолд было высоко оценено - в 2022 им была присуждена премия Прорыв (Breakthrough Prize), не столь престижная как Нобелевская, но с бОльшим призом (3 миллиона долларов), а в этом году они получили и Нобелевскую премию (подробнее:   https://prof-afv.livejournal.com/197541.html ).

Однако по мере угасания эйфории по поводу возможностей АльфаФолд и сходных программ, отчётливее становятся их ограничения.



Во многом они связаны с тем, что эти программы в какой-то степени функционируют по принципу «зубрёжки». Если им задаётся вопрос, отсутствующий в «шпаргалке», они не могут на него правильно ответить. Например, пока они малоэффективны в предсказании биологически значимой функции тех или иных 3-D белковых структур, что необходимо для дизайна de novo белков c требуемой функцией (скажем, отсутствующих в природе ферментов). Дело в том, что данных для формирования соответствующей «шпаргалки», аналогичных PDB, очень мало - обучать не на чем.

Также ограничены по объёму и во многом закрыты данные по взаимодействию различных фармакологически значимых белков с низкомолекулярными соединениями (потенциальными лекарственными препаратами - ингибиторами или активаторами). Такие данные каждая фармкомпания держит в секрете.

В дополнение программы типа АльфаФолд, не умеют «признаваться» в том, что они чего-то не умеют. Если вопрос задан, ответ они выдают и на один и тот же вопрос может быть получено множество ответов. Если же вопросы относятся к «терра инкогнита» установить правильный ответ, не прибегая к экспериментальным проверкам, почти невозможно. Последнее же требует на порядки больше времени, не говоря уже о деньгах.

И этим вызовы, стоящих перед дизайнерами белков, не исчерпываются. Подробнее об этом можно почитать здесь: https://www.nature.com/articles/d41586-024-03595-9 .

Проф_АФВ

дизайн белков de novo, 3D-конформация белка, АльфаФолд

Previous post Next post
Up