Автоматический поиск "украденных" фотографий

Aug 22, 2012 09:43


Во вчерашней статье "Как найти кто украл мои фотографии?" я обещал рассказать о программе, которая автоматически выполняет групповой поиск сайтов, которые забрали Ваши фотографии к себе. Программу пришлось писать самому, т.к. ничего подобного я не нашел. И так как программировать на чем-то кроме как 1С, я не умею - пришлось использовать ее возможности.

Этап №1. Загрузка ссылок на фотографий в базу
Ссылки на фотографии, которые нужно проверять можно добавить в базу вручную. Но т.к. на Яндекс.Фотках у меня более 1000 фотографий, то сделал автоматическую загрузку ссылок на них. Загружаются альбомы, ссылки на фотографии и их названия:




Этап №2. Автоматический поиск ссылок на фотографии
В принципе, можно просматривать и в ручном режиме. Выбираем, интересующий нас Альбом (или все фотографии) и проходимся по списку фотографий. При желании кнопками "Google" и "Яндекс" сразу можно посмотреть результаты поиска текущей фотографии в разных поисковиках:





С помощью кнопки "Выполнить групповой поиск..." программа начнет в автоматическом режиме последовательно искать фотографии из списка, в указанных поисковиках. Все найденные ссылки, программа будет сохранять в карточку фотографии. Выглядит это так:



Чтобы в дальнейшем было проще анализировать результаты поиска - ссылке присваивается "Категория ссылки". В настройках программы можно задать список доменов и какую категорию им присвоить по-умолчанию. Так для домена "z-alexey.livejournal.com" я поставил в настройка "Мой ресурс", а для форума На-связи и других ЖЖ юзеров поставил "Дружественный ресурс". Если домен не найден в списке, то ему присваивается "Непроверенный ресурс" и в дальнейшем остается только перейти по ссылке и посмотреть кто забрал фотку.

Этап №3. Анализируем найденные ссылки
Ну и заключительный этап. Формируем отчет, который разбивает ссылки на категории: "Нарушитель", "Непроверенный ресурс" и т.д. и просматриваем какие фотографии на каких ресурсах используются. И при необходимости меняем значение "Непроверенный ресурс" на нужную категорию. Примеры отчета:



Конечно, отчет можно сформировать и в другом виде. Например можно посмотреть какие фотографии чаще всего используют.

Подводные камни

  • Во время тестирования всей этой системы выяснилось, что Яндекс может находить одну и ту же фотографию если подсунуть размер 1024 пикселей и не находит если указать на оригинал (2400 пикселей). Поэтому при групповом поиске программа прогоняет все фотографии по нескольким размерам. Кстати, именно по этой причине лучше пока искать фотографии, которые лежат на Яндекс.Фотках.
  • Один раз Гугл тормознул мою проверку, в связи с частыми запросами. Но через 5 минут все опять возобновилось :)
  • Иногда случаются сбои и в выборку попадают похожие изображения, но не ваши :)


Проверю Ваши фотографии - бесплатно
Для объективного тестирования, я могу проверить Ваши фотографии.  Условия следующие:

  • Фотографии должны лежать на Яндекс.Фотках - пришлите свой ник
  • Укажите какие альбомы желаете проверить (общее количество - не более 100 фотографий), альбом и фото должен быть без пароля
  • Только для тех, у кого я нахожусь в друзьях (добавить меня в друзья)
  • Пишите информацию на почту:
    , отчет о найденных ресурсах придет на вашу почту.


Делюсь опытом, 1c, Авторские права,

Previous post Next post
Up