Визуализация влияния batch_size на качество модели wordchar2vector

kelijah

Визуализация влияния batch_size на качество модели wordchar2vector - ч.3

Mar 22, 2018 19:09

Продолжение поста https://kelijah.livejournal.com/237155.html.

То, что казалось достаточно очевидным и логичным, стало интересным при увеличении количества исходных данных. Я погонял обучение модели на новых batch_size и даже по 2 раза для некоторых batch_size, и получается вот такое облако для максимальной достигаемой точности при разных batch_size:

Спад для batch_size>=1000 достаточно четкий, но вот все что слева уже не такое простое. Можно видеть даже, как batch_size=180 и 500 дают очень близкие результаты, это больше похоже на плато или макушку параболы.

neural nets, word2vector, word2vec, word embedding, neuronet