1. Берем кучу диалогов. Я для эксперимента взял всего ~300Мб из имеющихся 20 Гб, но только ради быстрой проверки идеи.
2. В каждом диалоге перед последней репликой ставим специальную "управляющую" строку такого вида:
[l=123]
Где 123 - длина последней реплики в символах.
Обучающие данные получаются примерно такие:
- Ты кто?
[l=9]
- Дед Пихто
(
Read more... )