АльфаФолд это программный инструмент, в основе которого лежит нейросеть, обученная на огромном массиве данных о 3-D структуре белков, собранных в PDB (Protein Data Bank). Собственно, наличие PDB как общедоступной базы данных, явилось важным, если не решающим, фактором, обеспечившим «победный рывок» АльфаФолд 2 в решении проблемы предсказания 3-D структуре белков по их первичной структуре т.е. последовательности аминокислот (подробнее:
https://prof-afv.livejournal.com/87693.html ). Это достижение разработчиков АльфаФолд было высоко оценено - в 2022 им была присуждена премия Прорыв (Breakthrough Prize), не столь престижная как Нобелевская, но с бОльшим призом (3 миллиона долларов), а в этом году они получили и Нобелевскую премию (подробнее:
https://prof-afv.livejournal.com/197541.html ).
Однако по мере угасания эйфории по поводу возможностей АльфаФолд и сходных программ, отчётливее становятся их ограничения.
Во многом они связаны с тем, что эти программы в какой-то степени функционируют по принципу «зубрёжки». Если им задаётся вопрос, отсутствующий в «шпаргалке», они не могут на него правильно ответить. Например, пока они малоэффективны в предсказании биологически значимой функции тех или иных 3-D белковых структур, что необходимо для дизайна de novo белков c требуемой функцией (скажем, отсутствующих в природе ферментов). Дело в том, что данных для формирования соответствующей «шпаргалки», аналогичных PDB, очень мало - обучать не на чем.
Также ограничены по объёму и во многом закрыты данные по взаимодействию различных фармакологически значимых белков с низкомолекулярными соединениями (потенциальными лекарственными препаратами - ингибиторами или активаторами). Такие данные каждая фармкомпания держит в секрете.
В дополнение программы типа АльфаФолд, не умеют «признаваться» в том, что они чего-то не умеют. Если вопрос задан, ответ они выдают и на один и тот же вопрос может быть получено множество ответов. Если же вопросы относятся к «терра инкогнита» установить правильный ответ, не прибегая к экспериментальным проверкам, почти невозможно. Последнее же требует на порядки больше времени, не говоря уже о деньгах.
И этим вызовы, стоящих перед дизайнерами белков, не исчерпываются. Подробнее об этом можно почитать здесь:
https://www.nature.com/articles/d41586-024-03595-9 .
Проф_АФВ