От nVidia.

Jun 24, 2013 02:37

http://http.download.nvidia.com/developer/cuda/seminar/TDCI_Arch.pdf

В районе странички 23 подводится итог, почему скалярные устройства лучше векторных (SIMD с фиксированным словом).

gpgpu, суперкомпьютеры

Leave a comment

thedeemon June 24 2013, 03:59:31 UTC
Скорее, почему тыщи скалярных устройств лучше сотен векторных.

Reply

andybil June 24 2013, 04:47:27 UTC
Ну, они верят в природу человеческого глаза. По 10 Мп в каждом.

Reply

thesz June 24 2013, 08:38:16 UTC
Векторные надо с умом делать.

Ни одна система команд для векторных машин не умеет делать загрузку и сохранение по вектору адресов. А это чрезвычайно ценно.

Reply

thedeemon June 24 2013, 09:00:50 UTC
Это да. Кстати, в подтверждение тезиса, сейчас наблюдаю на текущей задаче, как векторизованный код дает неплохое ускорение на Core 2, но на более свежем Core i3 скалярный код выполняется уже примерно со скоростью векторизованного, т.е. хорошо используя мощности конвеера и параллельных устройств внутри, векторизация происходит неявно сама.

Reply

blacklion June 24 2013, 19:26:09 UTC
А векторизованный на свежем, особенно целочисленный, но написанный через AVX2?
Вот Алекс Тутбалин, которому я склонен доверять в этих вопросах, пишет, что там прямо счастье-счастье наступило, что даже AVX1 сильно убыстрило всякую обработку битмап-графики, а уж с AVX2 он сейчас вообще таааакое напишет!

Reply

thedeemon June 24 2013, 19:51:21 UTC
Не, AVX пока не используем, т.к. аудитория очень широкая, свежие процы далеко не у всех. SSE2 лишь пока задействован.

Reply

blacklion June 24 2013, 19:24:48 UTC
Ни одна система команд для векторных машин не умеет делать загрузку и сохранение по вектору адресов. А это чрезвычайно ценно.
Меня на Курсере, в курсе про построение современнгых CPU, учили, что умели как минимум какие-то средние по поколениям Креи (когда они были уже достаточно развиты, но ещё с полностью своей архитектурой). Был там scatter-gather.

Но где те векторные машины, которые были изначально векторные, а не заплатой 5-го уровня вложенности, как AVX2?

Reply

thesz June 24 2013, 21:16:55 UTC
Современные револьверные Креи тоже "так умеют". Но там только выборка и сохранение по "a+i*q". Не могу одобрить.

Reply


Leave a comment

Up