Shiza technologies

Apr 23, 2010 13:25


Случайно наткнулся на программку Shazam в списке предлагаемых к загрузке на Android Market. Запустил… и остолбенел. Програмулька превратила смартфон HTC Desire в музыкального знатока с широчайшей эрудицией. Друзь и К° отдыхают. Телефон слушает окружающее его пространство и выдаёт имя исполнителя и название песни, которая сейчас играет! Вот снимок экрана HTC Desire с результатом «прослушивания» музыкального телеканала.



Да они там охренели! Я смотрел на это чудо и не верил своим глазам. Пещерного человека отвели в кино. Как это работает? Сигнатуры? Частотный анализ? Искусственный интеллект? Как человек, знакомый с математикой и программированием, - не понимаю! Ясно одно - первоклассных технических возможностей смартфона на это не хватит. Секунд 10 аппарат «слушает», потом отправляет запрос на сервер Shazam. На всю операцию до получения ответа уходит секунд 20, не больше.

Восхитившись, начал испытания, как и положено русскому человеку. Помните анекдот про японскую бензопилу? Забегая вперёд, скажу, что английская «бензопила» «кряк» не сказала. Слушал радио, разговаривал с водителем, и одновременно запускал определение песен. Программке все шумы по барабану - звук двигателя, наш разговор. Определяет всё подряд. И тут же даёт ссылку для покупки оригинального трека в .mp3 с Amazon.com.


Ну ладно, их западные песни определяются на раз. ngergel подсунул программке некий альбом стиля Black Metal, где сам с трудом отличает одну песню от другой. - Вжик!, - сказала бензопила. И назвала песню.

А если нашу попсу? Потыкал кнопки на радио в машине, нашёл непривычные радиостанции. Жуть. Она и наших находит, причём с названиями на русском.


Тут уж меня окончательно заинтриговали. Полез на сайт Shazam. Английская контора создана в 2002 году. Вот какой баян получился - длиной в восемь лет. Но как-то баян всё мимо меня проезжал. Сейчас у Shazam в базе 8 миллионов треков. Нет, ещё раз: восемь миллионов (!) треков. До 50х годов включительно. И по этой базе оцифрованной музыки они проводят поиск за 10 секунд. Я в шоке.

Теперь я понимаю, почему у меня не получилось засунуть на YouTube мой ролик Thistlegorm, на который наложена композиция Coronarias Redig от Deep Purple. Когда YouTube не принял ролик в первый раз, мотивируя тем, что музыка защищена авторским правом, я начал экспериментировать. Подрезал композицию с начала, с конца, пересчитывал с 44,1 кГц на 48, надеясь сбить алгоритм сравнения цифровых записей. Теперь я понимаю, насколько смешны были мои потуги. Алгоритм, видно, тот же, что и в Shazam. Ему достаточно 10 секунд любого отрывка песни для вынесения приговора!

Google шагнула дальше, в ещё более ресурсоёмкую область - распознавание образов. На Android Market доступна бесплатная программка под названием Google Goggles. «Надев» гугловские очки, вы сможете узнавать, что за объекты находятся рядом с вами. В описании сказано, что надо запустить программу и сфотографировать объект. Зная ваше местоположение, определяемое посредством сотовой сети или встроенного датчика GPS, программа производит поиск среди близлежащих объектов. Сравнивает изображения, и рассказывает о том, что вы видите.

Здесь задача посложнее, и работает распознавание образов похуже. Но работает! Вот история запросов. Снимок справа я сделал с экрана компьютера. Самый посещаемый туристический объект мира был распознан, невзирая на моё местоположение.


Выскочил экран с названием объекта, ссылкой на карту и результатами поиска по названию объекта в Google. Исчерпывающе.


Сделанную из окна машины фотографию универмага «Москва» программа распознать не смогла, равно как второй слева снимок в истории поиска. А вот о крайнем слева снимке из журнала, на котором красно-белое здание, была выдана следующая информация. Верная, кстати.


Надоело разглядывать здания? Хочется выдать «умняка» вечером с девушкой, разглядывая звёздное небо? Нет проблем! Google Sky Map выводит на экран карту ночного неба в том виде, как оно выглядит с конкретной точки вашего местонахождения. И сейчас. Поворачиваете телефон - поворачивается картинка. Солнце садится на западе, да. Полярная звезда - на севере, под углом к горизонту, равному географической широте. Ощущение такое, что в руках - экран видеокамеры. Только вот созвездия обозначены.


В общем, фантастика. Распознавание музыки и образов - основа искусственного интеллекта - в действии. Лет через пять камеры на улицах будут онлайн определять прохожих по лицам, с занесением в базу сведений о всех перемещениях объекта. Технологии стремительно меняют мир. Свои прогнозы на будущее ЖЖ я уже как-то излагал. В каждой шутке, как говорит М.Ж., есть доля шутки. Пока мы тут хихикаем, iPad уже вышел.

htc, технологии

Previous post Next post
Up