Ситуация интересная. До сих пор, мне не приходилось таким образом восстанавливать удаленные из интернета тексты, поэтому расскажу подробнее. Тем более, что автор материала, который я восстанавливал, не возражает.
Все картинки кликабельны. Под катом много скриншотов.
Итак, в блоге Платона Маматова (
kaisi) я увидел текст недельной давности, с названием:
"Тут был текст про политоту, но я его стер, ибо надоело".
Обычно в подобных случаях достаточно просто забраться в кэш Яндекса или Гугла, чтобы прочитать удаленный материал. Однако в данном случае, автор настолько быстро его удалил, что это не сработало.
"Насколько быстро стер - не помню. Четко помню что перечитал свой блог, подумал "заебало, тошнит", и стер", -
рассказал мне Платон.
Ситуация в кэше Яндекса сложилась любопытная. При запросе
' inurl:kaisi.livejournal.com/783970.html '
картинка в основной выдаче Яндекса была такой:
Я взял из полученного текста фразу "Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами" и далее стал работать с ней.
Основная выдача Яндекса, при запросе по этой точной фразе, сниппеты показала:
А основная выдача Гугла - нет:
Выдача Яндекса по блогам - показала, но очень своеобразно.
Сниппеты были видны:
Но вот при попытке раскрыть, и посмотреть полный текст - выскакивала уже новая версия поста, хотя и со старым (первоначальным) заголовком:
Попытка открыть из поиска по блогам Яндекса "сохраненную копию" выдавала уже измененный текст:
И попытка открыть сохраненную копию из основной выдачи Яндекса давала такой же отрицательный для меня результат:
Не буду делать скриншотов, а просто скажу, что остальные известные, и не очень известные поисковики, в которые я раздавал этот запрос, не смогли справиться с задачей - они вообще не видели этого текста. В базу данныз Айкубаз этот текст также не успел попасть - ни в новом, ни в старом виде.
Тогда я сделал запрос в Гугл не по точной фразе, а с помощью оператора inurl. Результат получился любопытный. Страница нашлась.
При этом, кэш Гугла, как и кэш в Янлексе, содержал новую версию страницы и ничем помочь мне не мог:
Но у Гугла была еще и нетекстовая информация - скриншот поста, сохраненного в его кэше. И этот скриншот был явно сделан с первоначального текста:
Качество изображения там, однако, таково, что разобрать весь текст не представляется возможным. Но отдельные слова, все же, читабельны.
Получается, что Гугл имеет скриншот первоначального текста и показывает его пусть и трудночитаемым, но зато целиком.
В то же время, Яндекс хранит и умеет показывать весь первоначальный текст и готов показывать его в виде сниппетов, но только не весь одновременно.
Я провел эксперимент, который оказался удачным: стал брать по одному-два слова из каждого абзаца на скриншоте и ставить их в поиск по блогу kaisi через расширенный поиск.
Вот как это выглядело.
Первый абзац и так показан Яндексом - его не надо было восстанавливать:
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Второй абзац был восстановлен по слову "рулит":
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Третий абзац - по слову "письма":
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Четвертый абзац - по слову "Крашенинников":
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Пятый абзац состоит из одного слова "Охуеть", которое и так видно.
Шестой абзац восстановлен по слову "особенности":
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Седьмой абзац читабелен на скриншоте Гугла: "Ох, отцы иезуиты. Как красиво. Мне очень нравится"
Восьмой абзац - восстановлен по слову "сном":
Пойду, забудусь сном.
Итак, текст, который в данный момент выглядит вот так:
Тут был текст про политоту, но я его стер, ибо надоело
Тезисно: Федя - мудак, кто ему верит - наивные кретины
Восстановлен в первоначальном виде:
Отцы иезуиты
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Охуеть
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Ох, отцы иезуиты. Как красиво. Мне очень нравится
Пойду, забудусь сном.
Полагаю, что специалистам
Конкурентной разведки, равно как и юристам, собирающим уничтоженные улики в Интернете, такой способ однажды может пригодиться.
И еще раз подтвердилась идея о важности сочетания текстовой, и нетекстовой информации при поиске в Интернете.