Comments | ailev: Грубая вычислительная сила для нежных нейронных сетей

ailev

Грубая вычислительная сила для нежных нейронных сетей

May 19, 2016 02:18

Мнения о том, понимаем ли мы причины успешности/обучаемости глубоких нейронных сетей, расходятся. В конечном итоге, всё заканчивается спором о термине "понимаем" -- там широкий диапазон между ( Read more... )

Comments 39

son_0f_morning May 19 2016, 13:48:26 UTC

А есть подход, который нормально делит память среди нейронов \ слоёв (так чтобы минимизировать обращения к чужой памяти с каждого процессора)? Ведь вам-то без разницы где узкое место в ALU или MMU.

На современных процессорах они настолько близки, что на простой Core на 1м процессоре можно упереться в DDR-4 если постараться (без использования SSE в вообще SIMD-инструкций).

i_v_s May 19 2016, 14:47:06 UTC

Есть сильное подозрение, что "вкладыш-в-ухо-переводчик" - это просто блютус гарнитурка, а перевод работает где-то на облаках гугл-транслейта.

perepertoz May 19 2016, 14:58:48 UTC

.... но пока 4G работает - разница неочевидна :)

ext_2270505 May 19 2016, 16:56:12 UTC

Ещё один перспективный вариант компресии - http://sites.skoltech.ru/app/data/uploads/sites/34/2015/07/tensorNet_nips2015_arXiv.pdf
Матрица полносвязного слоя заменяется на тензорный поезд (авторы tensor train действительно имели в виду поезд), матричные операции заменяются на операции над тензорным разложением, позволяя не только получать низкоранговый результат на выходе, но и все промежуточные вычисления тоже требуют мало памяти (при сопоставимом времени).
В результате можем иметь компрессию полносвязного слоя по памяти в 10'000 при незначительном падении качества.

trubetskoyroman June 24 2016, 19:08:46 UTC

> понимаем ли мы причины успешности/обучаемости глубоких нейронных сетей

Имхо: Работу сверточной сети можно рассмотреть как работу алгоритма monte-carlo tree search, ограниченного рамками топологии сети. Вся теоретика вокруг этого алгоритма применима и к сверточным сетям.
(Не путать: Иногда сверточные сети работают в паре с монте-карло, но тут я говорю именно о монте-карло внутри сверточной сети)