Еще немного результатов оценки моделей читчата, которые я сам тренировал, на простых арифметических задачах. В отличие от ранее приводившихся оценок, тут модели тренировались на большом датасете диалогов с небольшой добавкой арифметических сэмплов.
Результаты:
ruT5-large, только читчат ~0.97
ruGPT-large, только читчат ~0.91ruGPT-large, читчат+
(
Read more... )