Дэмис Хасабис использует термин "General Purpose Learning Machine". Он сказал что это будет ИИ-ученый. Это есть в видео "Google's DeepMind CEO- Future & Capabilities of Artificial Intelligence(AI)" от начала года. Говорит, что это цель всех бриллиантовых гениев в DeepMind. Что мешает к "PathNet: Evolution Channels Gradient Descent in Super Neural Networks" прикрутить MCTS от AlphaZero. PolicyNet не просто делает свои очередные ходы в игре, а она генерирует игры в MCTS из самой себя и не случайно, а с учетом связности, свежести (+немного случайности). В качестве Value Network пусть выступает Input (из среды) пропущенный через PolicyNetwork (базовые вознаграждения: за новизну и за улыбку задаем жеще. Детектор улыбки простой CNN, а с новизной сложнее
( ... )
Простое дерево поиска не годится для не perfect задач. Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы: Imagination-Augmented Agents for Deep Reinforcement Learning. https://arxiv.org/abs/1707.06203 Learning model-based planning from scratch. https://arxiv.org/abs/1707.06170 Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить. Запись в блоге DeepMind: https://deepmind.com/
Я прочитал вышупомянутые комментарии дипмайндовцев на Лэйка (https://arxiv.org/abs/1711.08378 ) и осознал, что приведенная мной концепция (скрещивания pathnet и alphago) несостоятельна. Ибо сетка такая не сможет пользоваться своей внутренней моделью ни для запоминания, ни для моделирования гипотиз (мыслей). Приведу цитаты из дипмайндовцев
( ... )
Reply
Reply
А тут используют термин "humanlike intelligence" https://arxiv.org/abs/1711.08378
Reply
Оказывается я пропустил, что дипмайндовцы летом сделали неплохой моделлер "мира" полностью на нейросетях, он в зачаточном состоянии, но автоматически выучивает модели для разных задач и при этом может этими моделями пользоваться для моделирования/воображения, это две работы:
Imagination-Augmented Agents for Deep Reinforcement Learning. https://arxiv.org/abs/1707.06203
Learning model-based planning from scratch. https://arxiv.org/abs/1707.06170
Вторая мне больше понравилась. К ним бы еще привинтить Elastic Weight Consolidation и капсулы Хинтона и вместо LSTM для памяти использовать что-нибудь получше. И обучаемость с первого раза сделать благодаря автоматической генерации трансформаций и автоматический контроль оверфита обеспечить.
Запись в блоге DeepMind: https://deepmind.com/
Reply
Reply
работает только сообщество таких сеток (ну вот как в Island Based GA) общающихся между собой... и вот тогда ... :)
Reply
Reply
Leave a comment