Неделю назад российский интернет обошла новость что в МГУ появляется новый суперкомпьютер, 400 петафлопс и всё такое. Если верить
ТАСС, Садовничий заявил что «Этот супервычислитель, может быть, будет вторым-третьим в мире по мощности». 400 петафлопс конечно не был бы ни вторым, и ни третьим, по вполне солидный суперкомпьютер.
Чуть позже новость появилась официально
на сайте МГУ. И тут оказалось, это не 400 петафлопс, а 400 AI петафлопс. Что называется следите за руками. Что означает AI? Что операции не с 64х битными числами с плавающей точкой, как положено в настоящих петафлопсах, а с 16-битными, как это реализовано во всяких видеокарточках. Для AI действительно достаточно. Сколько настоящих петафлопс - МГУ стыдливо не говорит, но должно быть примерно на порядок меньше, в одном месте
пишут 29.
Я решил сравнить с коммерческим предложением, скажем в Гугл-облаке. Заявлено что комп занимается AI, поэтому берем TPU. В Гугле предлагают TPU -
Peak compute per chip - 275 teraflops (bf16 or int8), это те самые «AI» флопсы. Можно взять от одного TPU до целого модуля (pod) в 4096 chips. Неожиданно, модуль даст почти в три раза больше петафлопс чем «суперкомпьютер». При этом сеть на чип быстрее в 6 раз, полный интерконнект неизвестно во сколько, МГУ не публикует, - но осторожно можно оценить в пару порядков.
По стоимости, у МГУ вышло 10 млрд, то есть 100 млн $ по нынешнему курсу (хотя собирали по лучшему, но это мелочи). Чтобы получить сравнимую мощность, рентанём полторы тысяч TPU (чуть меньше половины модуля) у Гугла, будет 412 AI пф. 100 млн $ хватит на
5 лет 24x7 с 3х годичным минимальным контрактом. Правда, в Гугловскую цену включены стоимость обслуживания, замены поломок, электроэнергия, охлаждение, и тд, а к 10 млрд МГУ всё это надо будет добавлять. Обычно стоимость эксплуатации примерно равна стоимости начальной покупки, так что полных затрат МГУ хватило бы наверное на 10 лет аренды в Гугле.