Специальные поисковики, которые находят кое-что лучше Гугла и Яндекса
Nov 19, 2013 14:11
Оригинал взят у ihoraksjuta в Специальные поисковики, которые находят кое-что лучше Гугла и Яндекса Всё дело в универсальности: невозможно одинаково хорошо искать в блогах и в научных статьях, в цифровых изображениях и кулинарных рецептах. Именно поэтому существует множество не столь известных специализированных поисковых систем, которые работают исключительно с какой-то одной категорией данных, но делают это на высочайшем уровне.
Более того, многое из находимого такими поисковиками вообще невозможно отыскать при помощи Google и других универсальных систем: они просто не видят такую информацию, которая к тому же нередко умышленно закрыта для подобных «веб-пауков». Поговорим о нескольких таких «узких профессионалах», способных, возможно, открыть для вас ту сторону интернета, о которой вы и не подозревали.
Не для кого не секрет, что правительства многих стран пытаются повлиять на то, какой сетевой контент доступен на территории их государств. Это может объясняться как чисто политическими соображениями, так и требованиями законодательства о противодействии терроризму и детской порнографии и, конечно же, влиянием лоббистов крупных правообладателей. Критерии запретов могут быть как вполне разумными, так и совершенно произвольными: всё зависит и от общего состояния правосознания в стране, и от вменяемости самих правоохранителей.
Поисковая система Google в большинстве случаев идёт навстречу мотивированным требованиям национальных правительств и удаляет из результатов поисковой выдачи сайты и страницы, доступ к которым через локализованные версии поисковика должен быть запрещён. Между тем удаление адреса из результатов поиска Google и даже блокировка URL и IP-адреса на уровне местного провайдера вовсе не означает, что такой ресурс исчез из интернета или больше недоступен.
Классическое средство обхода подобных ограничений - браузер Tor, основанный на системе альтернативной обычной «луковой» маршрутизации. Один из новейших пакетов, включающих в себя клиент Tor (Vidalia) и браузер Firefox Portable c расширением foxyproxy, носит вполне «говорящее» название PirateBrowser.
От других подобных пакетов он отличается тем, что не предназначен для полностью анонимного сёрфинга: PirateBrowser использует сеть Tor исключительно для обхода местных блокировок тех или иных страниц и сайтов, подставляя произвольные IP-адреса вместо настоящих. С его помощью вы можете зайти на заблокированную страницу, если уже знаете её адрес, либо поискать её, например, через основной сайт Google.com или какие-то другие его локальные версии.
В PirateBrowser уже встроены настройки для некоторых стран, включая Иран, Северную Корею, а также (сюрприз!) Великобританию, Нидерланды, Бельгию, Финляндию, Данию, Италию и Ирландию. Разумеется, ничто не мешает внести в систему и собственные настройки. К сожалению, в отличие от «полноценного» Tor, PirateBrowser доступен только в версии для Windows.
2. Поиск среди несуществующих версий страниц
Многие из нас пользовались кешем Google или «Яндекса», чтобы посмотреть недавно изменённую или удалённую страницу в том виде, в каком она была изначально опубликована в Сети. Обычно такой кеш доступен в поисковой выдаче довольно короткое время, ведь поисковый робот настроен на отслеживание и учёт всех изменений, чтобы выдавать наиболее актуальную версию интернет-ресурса.
Поэтому, если вы хотите знать, как выглядел тот или иной сайт месяц, год, а тем более несколько лет назад, вам придётся воспользоваться другим средством, а именно веб-сервисом «Архива Интернета», который носит название Wayback Machine, то есть что-то вроде «Машины времени». Некоммерческая организация «Архив Интернета» с 1997 года собирает копии веб-страниц, мультимедийный контент и программное обеспечение, размещаемое в Сети, и делает эти копии доступными бесплатно для всех желающих. При помощи Wayback Machine вы сможете найти не только версию знакомого вам сайта многолетней давности, но и даже те страницы, которых давно не существуют и которые попросту удалены из «обычного» интернета. На сегодня в архиве присутствует около 366 миллиардов страниц, и очень велика вероятность того, что среди них окажется та, что нужна именно вам.
3. Поиск изображений
Самый распространённый способ найти какую-то картинку - это, конечно же, воспользоваться Google Images. А как быть, если вы всё-таки не смогли найти подходящее изображение привычными средствами? Можно, к примеру, попробовать специализированный сервис Picsearch, в котором, как утверждают его создатели, проиндексировано больше трёх миллиардов цифровых картинок.
У Picsearch есть не только многоязычный пользовательский интерфейс, но и полноценный многоязычный поиск, а также несколько полезных фильтров, включая поиск только чёрно-белых или цветных изображений, картинок с преобладанием какого-то конкретного цвета, поиск «обоев» для рабочего стола, а также лиц или анимированных изображений.
Гораздо меньшим объёмом заявленной проиндексированной базы может похвастаться поисковая система Everystockphoto: она содержит более 20 миллионов изображений, хранящихся на онлайновых фотосайтах, включая Flickr, Fotolia и Wikimedia Commons. Тем не менее результаты её работы весьма впечатляют. Большинство из найденных снимков можно использовать бесплатно, но с условием указания имени фотографа или правообладателя.
4. Вычислительно-поисковая система
Как известно, поисковая система Google умеет проводить несложные вычисления, конвертировать из одних единиц в другие и делать некоторые другие полезные вещи, не связанные непосредственно с поиском. Однако если вам нужны ответы на действительно сложные вопросы в области математики, физики, медицины, статистики, истории, лингвистики и других областей науки, то вам не обойтись без «вычислительно-поисковой системы» WolframAlpha, способной предложить пользователю чуть ли не энциклопедические ответы на самые необычные вопросы.
Фактически это даже не совсем поисковая система, а огромная база данных, часть которой преобразована в вычислительные алгоритмы, что и позволяет получать готовые сведения о том, сколько граммов протеина содержится в десятке конфеток M&M’s, какова ожидаемая средняя продолжительность жизни в США, Швеции и Японии в текущем году или как решается алгебраическое уравнение.
5. Поиск людей
Казалось бы, найти человека в интернете, зная его имя и фамилию, проще простого. Да, если это какая-то знаменитость, кинозвезда, спортсмен или постоянный пользователь социальных сетей. Тогда первая же страница результатов поиска Google даст вам практически исчерпывающую информацию о том, кто это такой и чем занимался в последнее время. Если же тот, кого вы ищете, не жаждет широкой популярности и не увлекается сетевым эксгибиционизмом, найти информацию о нём в интернете будет не так просто.
В этом случае можно попробовать поисковую систему Pipl, которая осуществляет поиск людей в целом ряде публичных реестров, онлайновых баз данных, служб и всё-таки в социальных сетях, в том числе и профессиональных. В отличие от большинства подобных сервисов, Pipl работает и с кириллицей, так что он вполне работоспособен и с русскоязычными фамилиями.
Отечественный сервис SpravkaRU.NET поможет обнаружить адрес и домашний телефон жителя России, Украины, Беларуси, Казахстана, Латвии и Молдовы. Этот сайт представляет собой электронный телефонный справочник некоторых крупных городов перечисленных стран, но, увы, далеко не полный.
Больше шансов найти жителей Москвы или Санкт-Петербурга, причём только тех, на кого оформлен домашний номер. В отличие от альтернативных сервисов, SpravkaRU.NET содержит вполне актуальные базы, и если вы располагаете хотя бы некоторой информацией о родственниках или примерном месте проживания разыскиваемого, то он способен помочь вам установить его телефон и адрес.
6. Поиск научной информации
Если вы занимаетесь наукой и хотите найти свежие научные публикации по вашей теме в Google, то вам нужно срочно забыть об открытиях и заняться чем-то менее интеллектуальным. В Google вы сможете обнаружить лишь ссылки на отдельные работы, опубликованные на каких-то общедоступных сайтах вроде Википедии. В действительности практически все научные статьи хранятся на веб-серверах, относящихся к категории так называемого глубокого Веба, который по различным причинам недоступен для универсальных поисковых систем.
Всё дело в принудительном запрете на индексацию каких-либо данных, которые хотя и не относятся к секретным, но составляют некую служебную информацию или не представляют интереса для широкой публики. Это и библиотечные каталоги, и медицинские или транспортные базы данных, и каталоги всевозможной промышленной продукции. «Пауки» не могут обойти систему обязательной регистрации или ограничения доступа, поэтому в результатах выдачи Google вы редко увидите научные материалы, попросту непонятные людям, которые не занимаются аналогичными исследованиями.
Приоткрыть дверь в научный «глубокий веб» способен специализированный поисковик CompletePlanet, имеющий доступ более чем к 70 000 научных баз данных и узконаправленных поисковых систем. (C)
Если Вам понравился пост, можете разместить его у себя в журнале или поделиться этой новостью с друзьями, благодаря вот этим клавишам