Обучение с подкреплением: metamodeling

serj_aleks in metamodeling

Обучение с подкреплением

Nov 12, 2019 11:50

https://habr.com/ru/post/475236

OpenAI Gym, Агент, Окружающая среда, Действия, Наблюдния, Вознагрождения, Ситуация, Решение, Марковский процесс, Состояние, Модель перехода состояний, Скидка, Ценность, Политика, Эпизод

https://towardsdatascience.com/dont-ever-ignore-reinforcement-learning-again-4d026ee81371

реализация, библиография, философия, метавычисления, словарь, теории

Leave a comment

Read comments 2

Previous post

Next post