Датасет с ударениями для русского лексикона (>1.6 миллионов слов)

Sep 29, 2018 12:24

В репозиторий https://github.com/Koziev/NLP_Datasets выложен мой датасет с данными об ударениях.
Примерно такой объем был использован в коде лексического шаблонизатора для конкурса ClassicAI.
Поясненения есть в README.md, сам упакованный датасет доступен по ссылке.

соревнования, русский язык, датасеты, лексика

Previous post Next post
Up