Визуальный поиск в Интернете

Jan 16, 2010 20:17



Что делает специалист конкурентной разведки, когда хочет узнать - на каких Интернет-страницах встречается упоминание, скажем, Василия Ивановича Пупкина? То же самое, что и любой пользователь, мало-мальски знакомый  с поисковыми системами - набирает в строке запроса поисковика "Василий Иванович Пупкин" и просматривает результаты. Специалист, разве что, воспользуется языком поисковых запросов, чтобы получить более точный и менее "замусоренный" результат. Или воспользуется специальной программой, вроде СайтСпутник, которая сама "опросит" множество поисковиков, удалит "дубли" и т.д. Но принцип, в любом случае, один и тот же - обратиться к поисковой системе и указать в запросе ключевые слова, по которым и будет вестись поиск в Интернете. В нашем случае эти ключевые слова "Василий Иванович Пупкин".

Но что делать, когда у нас нет ФИО интересующего нас человека, а есть только его изображение? Фотография. Ну, положим, искали мы информацию по Пупкину и набрели на фото, где Василий, наш, Иванович с каким-то интересным гражданином в обнимку, а кто тот гражданин - не указано... Или другая задача: выяснить - на каких сайтах было опубликовано то или иное изображение.

До недавнего времени эта проблема была почти нерешаемой. Найти изображение по ключевым словам? Почти нереально. Как "объяснить" поисковику, что вам нужен "лохматый мужик с бородой в черной куртке, пьющий из горла "Балтику №9", на фоне явно нетрезвой блондинки"? Не поймет поисковик. А если "поймет" и найдет, то при условии, что тот, кто размещал фотографию на своей странице сопроводил ее таким текстом, такими ключевыми словами. А отсканированное фото в строку запроса не запихаешь... Было бы проще, если бы файл картинки везде имел одно и то же имя, но каждый, ведь, норовит переименовать как ему заблагорассудится.

Сейчас задача немного упростилась. Немного - потому что сервис поиска по изображениям еще доводится до ума, но уже сейчас дает вполне впечатляющие результаты.

Речь про разработку канадской компании Idee - визуальную поисковую машину TinEye. Система позволяет находить изображения схожие с исходным, которое  вы "даете" ей для сравнения. Причем, качество исходника вполне может быть на уровне превью - системе, чаще всего, этого будет вполне достаточно. TinEye, кроме того, может находить оригиналы даже по измененным в графических редакторах изображениях. Иван Бегтин ivbeg , впрочем, вволю поизмывался над TinEye и результаты тестирования можно прочитать в его блоге.

Возьмем, к примеру, фотографию Сары Пэйлин из сообщения латвийского новостного сайта NovoNews, у которого я ( как выяснилось) подрабатываю фотобанком и уже давно.

Вот адрес этого изображения, которое мы указываем в соответствующей строке запроса TinEye.




Либо - закачиваем наше изображение с носителя в TinEye, если картинки еще нет в Интернете. Ищем, смотрим результаты.




Лейла Бужнан, генеральный директор компании-разработчика Idee, рассказывала, что с помощью TinEye удалось установить личность неизвестного солдата по фотографии, сделанной в Нормандии.  Система нашла файл на одном из американских сайтов с полным списком изображенных на фотографии людей. Конкурентная разведка в чистом виде.

Информационные войны "под ключ"

бизнес-разведка, Интернет, деловая разведка, Александр Кузин, поисковые системы, конкурентная разведка, визуальный поиск

Previous post Next post
Up