В комментарии к
предыдущему посту коллега
p2004r подсказал замечательную мысль по поводу того, что надо бы смотреть не на количество эпох, а на количество градиентов, которые увидела сетка при обучении. И получается вот такая замечательная картина.
1) Смотрим по-старому, динамика обучения в зависимости от числа эпох:
(
Read more... )
Comments 5
Можно автору keras в git такое предложение о развитии функций пакета добавить.
Reply
При необходимости можно воспользоваться штатным механизмом колбэков https://keras.io/callbacks/ и добавить что-то свое, сохранять хоть в БД.
А переход от эпох к батчам в принципе делается тривиально.
Reply
Иначе зачем там вообще введен "объект", который не имеет "методов" учитывающих "его природу и размерность"? Генерик функция "нарисовать" должна принимать несколько объектов истории и учитывать ситуацию изменения размера batch.
PS Вообще все эти "эпохи" (которые то и "логичны" только когда не написан fit-генератор и сделана заглушка для простых случаев train), по сути имеем решение сделанное от рандомизации "в стиле складного ножа", и еще большой вопрос как оно соотносится по эффективности с простой "выборкой с возвращением"...
Обычно простой бутстреп лучше чем "складной нож".
Ну вот выкиньте из fit-генератора этой задачи условие "обходить все случаи в обучающей выборке каждую эпоху строго по одному разу"?
Reply
>Ну вот выкиньте из fit-генератора этой задачи условие "обходить все случаи в обучающей выборке каждую эпоху строго по одному разу"?
Вот насчет бутстрепа я действительно никогда не думал применительно к подаче датасета на сетку, спасибо за идею. Сразу возникает вопрос - а может ли это дать какой-то бонус на маленьких выборках? Надо бы попробовать на рабочей задаче, сравнить точность на валидации.
Reply
Leave a comment