Простое дерево поиска не годится для не perfect задач.
Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы:
Imagination-Augmented Agents for Deep Reinforcement Learning.
https://arxiv.org/abs/1707.06203Learning model-based planning from scratch.
https://arxiv.org/abs/1707.06170Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить.
Запись в блоге DeepMind:
https://deepmind.com/blog/agents-imagine-and-plan/ View the entire thread this comment is a part of