Чтение перед сном

Jul 04, 2022 00:45

https://arxiv.org/pdf/1711.03953.pdf

Давайте замешаем несколько softmax через дополнительный softmax. ;)

Интересно в этом следующее: насколько получаемое распределение соответствует закону Ципфа?

Ответа у меня и у авторов статьи нет.

нейронные сети, языковые модели

Previous post Next post
Up