Я пересобрал генератор "
хайку" и
обычных стихов, выложил образы в докер-хабе:
генератор хайку - модель пересобрана с последними расширениями датасетов, использование typical decoding вместо nucleus sampling и куча других мелочей.
генератор стихов - новая базовая модель силлабо-тонической GPT с 355 млн параметров, файнтюн на новом датасете, typical decoding, улучшения в фонетическом транскрипторе и ударяторе, и прочее, и прочее.
Оба образа после старта запрашивают токен телеграм-бота и затем обрабатывают запросы на генерацию.
Основная проблема и задача для стихов - улучшить ранжирование сгенерированных текстов так, чтобы в top-3 обязательно попадал хороший пример. Сейчас иногда приходится просматривать много тухлых генераций в поисках годноты.