SiteSputnik - версия Invisible для работы с "Невидимым Интернетом"

Sep 30, 2010 00:24

"Программа для допроса Интернета" - SiteSputnik (СайтСпутник) обзавелась очень полезным дополнением - модулем для работы с Невидимым Интернетом.  Этот модуль позволяет увидеть доступные для любого пользователя страницы сайта, которые, в силу каких-то причин, оказались не проиндексированы поисковыми машинами.

Это одинаково полезно, как при получении информации с сайтов, которые представляют интерес для исследователя, так и для аудита собственных сайтов. Все, что СайтСпутник Invisible делает, может проделать пользователь и вручную. Но СайтСпутник значительно ускоряет этот процесс и делает его более точным.

Покажу работу SiteSputnik Invisible на примере сайта родного мне ВУЗа - Уральского Федерального университета (УрФУ, ранее он назывался УГТУ-УПИ).

Для того, чтобы продемонстрировать работу SiteSputnik Invisible, сначала делаю поиск документов в формате pdf на сайте Университета. Никакого скрытого смысла в этом нет, просто таких файлов обычно намного меньше чем html-страниц, и это сэкономит мне время.

Все картинки кликабельны.

Итак, запрос в Google: site:ustu.ru filetype:pdf

Среди результатов я выбрал адрес "cae.ustu.ru/download/ansys3.pdf "
Потому что, как учит Андрей Масалович, логично предположить, что есть и адреса вида  "cae.ustu.ru/download/ansys1.pdf" или "cae.ustu.ru/download/ansys4.pdf" 


Далее запускаю СайтСпутник в обычном режиме, и составляю карту "сайта" с адресом "cae.ustu.ru/download". Тоже для экономии времени.



Получается такая карта на основании страниц, известным различным поисковым машинам (СайтСпутник убрал всю дублирующуюся информацию и показал каждый адрес только один раз):



Затем даю СайтСпутнику задание по карте сайта найти невидимые поисковикам, но доступные людям ссылки:



И он находит такую ссылку:



Всё.

Невидимый Интернет, Сайтспутник, sitesputnik invisible, Ющук Евгений Леонидович

Previous post Next post
Up