Imagination/Planning/Modelling augumented agents from scratch: trubetskoyroman

trubetskoyroman

Imagination/Planning/Modelling augumented agents from scratch

Dec 30, 2017 13:40

Простое дерево поиска не годится для не perfect задач.
Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы:
Imagination-Augmented Agents for Deep Reinforcement Learning. https://arxiv.org/abs/1707.06203
Learning model-based planning from scratch. https://arxiv.org/abs/1707.06170
Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить.
Запись в блоге DeepMind: https://deepmind.com/blog/agents-imagine-and-plan/

View the entire thread this comment is a part of