Кейс. Восстановление быстро стертой информации, почти исчезнувшей из кэша поисковиков.

Mar 08, 2012 18:19

Ситуация интересная. До сих пор, мне не приходилось таким образом восстанавливать удаленные из интернета тексты, поэтому расскажу подробнее. Тем более, что автор материала, который я восстанавливал, не возражает.

Все картинки кликабельны. Под катом много скриншотов.

Итак, в блоге Платона Маматова (kaisi) я увидел текст недельной давности, с названием: "Тут был текст про политоту, но я его стер, ибо надоело".

Обычно в подобных случаях достаточно просто забраться в кэш Яндекса или Гугла, чтобы прочитать удаленный материал. Однако в данном случае, автор настолько быстро его удалил, что это не сработало.
"Насколько быстро стер - не помню. Четко помню что перечитал свой блог, подумал "заебало, тошнит", и стер", - рассказал мне Платон.

Ситуация в кэше Яндекса сложилась любопытная. При запросе

' inurl:kaisi.livejournal.com/783970.html '

картинка в основной выдаче Яндекса была такой:




Я взял из полученного текста фразу "Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами" и далее стал работать с ней.

Основная выдача Яндекса, при запросе по этой точной фразе, сниппеты показала:




А основная выдача Гугла - нет:




Выдача Яндекса по блогам - показала, но очень своеобразно.

Сниппеты были видны:




Но вот при попытке раскрыть, и посмотреть полный текст - выскакивала уже новая версия поста, хотя и со старым (первоначальным) заголовком:




Попытка открыть из поиска по блогам Яндекса "сохраненную копию" выдавала уже измененный текст:




И попытка открыть сохраненную копию из основной выдачи Яндекса давала такой же отрицательный для меня результат:




Не буду делать скриншотов, а просто скажу, что остальные известные, и не очень известные поисковики, в которые я раздавал этот запрос, не смогли справиться с задачей - они вообще не видели этого текста. В базу данныз Айкубаз этот текст также не успел попасть - ни в новом, ни в старом виде.

Тогда я сделал запрос в Гугл не по точной фразе, а с помощью оператора inurl. Результат получился любопытный. Страница нашлась.
При этом, кэш Гугла, как и кэш в Янлексе, содержал новую версию страницы и ничем помочь мне не мог:




Но у Гугла была еще и нетекстовая информация - скриншот поста, сохраненного в его кэше. И этот скриншот был явно сделан с первоначального текста:




Качество изображения там, однако, таково, что разобрать весь текст не представляется возможным. Но отдельные слова, все же, читабельны.




Получается, что Гугл имеет скриншот первоначального текста и показывает его пусть и трудночитаемым, но зато целиком.
В то же время,  Яндекс хранит и умеет показывать весь первоначальный текст и готов показывать его в виде сниппетов, но только не весь одновременно.

Я провел эксперимент, который оказался удачным: стал брать по одному-два слова из каждого абзаца на скриншоте и ставить их в поиск по блогу kaisi через расширенный поиск.
Вот как это выглядело.

Первый абзац и так показан Яндексом - его не надо было восстанавливать:

Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)

Второй абзац был восстановлен по слову "рулит":




Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".

Третий абзац - по слову "письма":




Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.

Четвертый абзац - по слову "Крашенинников":




Наш славный Федя Крашенинников написал моральную программу для оппозиции.

Пятый абзац состоит из одного слова "Охуеть", которое и так видно.

Шестой абзац восстановлен по слову "особенности":



Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.

Седьмой абзац читабелен на скриншоте Гугла: "Ох, отцы иезуиты. Как красиво. Мне очень нравится"

Восьмой абзац - восстановлен по слову "сном":




Пойду, забудусь сном.

Итак, текст, который в данный момент выглядит вот так:

Тут был текст про политоту, но я его стер, ибо надоело
Тезисно: Федя - мудак, кто ему верит - наивные кретины

Восстановлен в первоначальном виде:

Отцы иезуиты
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Охуеть
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Ох, отцы иезуиты. Как красиво. Мне очень нравится
Пойду, забудусь сном.

Полагаю, что специалистам Конкурентной разведки, равно как и юристам, собирающим уничтоженные улики в Интернете, такой способ однажды может пригодиться.

И еще раз подтвердилась идея о важности сочетания текстовой, и нетекстовой информации при поиске в Интернете.

Деловая разведка, улики в Интернете, Бизнес-разведка, Евгений Ющук, Коммерческая разведка, Кейс, восстановление стертой информации, Интернет-разведка, Платон Маматов

Previous post Next post
Up