От nVidia.

Jun 24, 2013 02:37

http://http.download.nvidia.com/developer/cuda/seminar/TDCI_Arch.pdf

В районе странички 23 подводится итог, почему скалярные устройства лучше векторных (SIMD с фиксированным словом).

gpgpu, суперкомпьютеры

Leave a comment

Comments 8

thedeemon June 24 2013, 03:59:31 UTC
Скорее, почему тыщи скалярных устройств лучше сотен векторных.

Reply

andybil June 24 2013, 04:47:27 UTC
Ну, они верят в природу человеческого глаза. По 10 Мп в каждом.

Reply

thesz June 24 2013, 08:38:16 UTC
Векторные надо с умом делать.

Ни одна система команд для векторных машин не умеет делать загрузку и сохранение по вектору адресов. А это чрезвычайно ценно.

Reply

thedeemon June 24 2013, 09:00:50 UTC
Это да. Кстати, в подтверждение тезиса, сейчас наблюдаю на текущей задаче, как векторизованный код дает неплохое ускорение на Core 2, но на более свежем Core i3 скалярный код выполняется уже примерно со скоростью векторизованного, т.е. хорошо используя мощности конвеера и параллельных устройств внутри, векторизация происходит неявно сама.

Reply


Leave a comment

Up