Простое дерево поиска не годится для не perfect задач. Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы: Imagination-Augmented Agents for Deep Reinforcement Learning. https://arxiv.org/abs/1707.06203 Learning model-based planning from scratch. https://arxiv.org/abs/1707.06170 Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить. Запись в блоге DeepMind: https://deepmind.com/
Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы:
Imagination-Augmented Agents for Deep Reinforcement Learning. https://arxiv.org/abs/1707.06203
Learning model-based planning from scratch. https://arxiv.org/abs/1707.06170
Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить.
Запись в блоге DeepMind: https://deepmind.com/
Reply
Leave a comment