В репозиторий
https://github.com/Koziev/NLP_Datasets выложен мой датасет с данными об
ударениях.
Примерно такой объем был использован в коде лексического шаблонизатора для конкурса
ClassicAI.
Поясненения есть в
README.md, сам упакованный датасет доступен
по ссылке.