Обучение с подкреплением

Nov 12, 2019 11:50





https://habr.com/ru/post/475236

OpenAI Gym, Агент, Окружающая среда, Действия, Наблюдния, Вознагрождения, Ситуация, Решение, Марковский процесс, Состояние, Модель перехода состояний, Скидка, Ценность, Политика, Эпизод

https://towardsdatascience.com/dont-ever-ignore-reinforcement-learning-again-4d026ee81371

реализация, библиография, философия, метавычисления, словарь, теории

Previous post Next post
Up