Oct 08, 2014 08:44
Возникла странная идея.
Делаем предобработку видеосигнала, ужимая исходное пространство наблюдаемого непосредственно образа в более компактное. Сжатие делаем просто и незатейливо - k-means.
Будучи статистическим инструментом, k-means на нормальных данных асимптотически сходится к некоторому набору паттернов. Другими словами, по мере накопления статистики координаты центроидов меняются всё меньше и меньше, "одеревеневают". Это правильно и полезно, так как стабилизация codebook позволяет вышестоящим уровням начать свою статобработку сжатого изображения, не опасаясь, что кодировка поплывет.
А теперь странный вопрос. Допустим, мы периодически (раз в минуту, в 10 минут, в час - метапараметр) сбрасываем статистику в k-means, деля количество обработанных векторов на 2. Или для красоты на 2.71. После такого деления новые поступившие вектора получают шанс сильнее изменить конфигурацию кластеров.
Получается инерционно-пластичный k-means, который постоянно медленно перестраивается, не выходя на асимптотику и не одеревеневая.
Есть ли практическая польза от такого эффекта в рамках модуля зрительного восприятия робота?
В натуральной системе такая "текущая" пластичность вроде бы есть. В частности, галлюцинация с мнимым продолжением движения окружающих машин при остановке и т.д. говорит, что зрительная система на нижнем уровне что-то меняет у себя в кодах. Но вот что это дает с точки зрения оперативной приспособляемости - понять не могу.
k-means,
роботы