В 1997 году два аспиранта Стэндфордского университета (один из которых наш соотечественник Сергей Брин) разработали алгоритм определения значимости веб-ресурсов в поисковой системе, назвав его PageRank. PageRank сам по себе является в какой-то степени побочным изобретение, так как целью было определение уровня цитирования научных статей, написанных в бумажном варианте, а поскольку из бумажного носителя приходилось переносить в электронный вид, родилась идея применения сложного алгоритма для ранжирования интернет страниц. Название PageRank, не переводится как - ранжирование страницы, а правильное значение, это ранжирование имени Пейджа (Ларри Пейдж один из двух, тех самых аспирантов).
PageRank - это алгоритм поисковой системы Google, цель которого определение значимости (авторитета) интернет-ресурса. Общий принцип работы заключается в определении количества ссылающихся ресурсов на определенный проект, за счет этого алгоритм вычисляет коэффициент ранжирования, с учетом количества ссылок, тематики ресурсов, значимости ссылающихся ресурсов. В отличие от ТИЦ, индекс ранжирования имеет большое значение для выдачи ресурса, по поисковым запросам (в Яндекс показатель ТИЦ не имеет в этом плане никакого значения), соответственно, чем выше индекс, тем ближе сайт к выдаче в системе.
Работа алгоритма PageRank в деталях известна только ограниченному кругу людей компании Google, однако наверняка можно отметить ряд принципиально важных показателей:
- количество ссылающихся ресурсов;
- качество ссылающихся ресурсов (по сути, не играет столь важную роль, как в случае с ТИЦ);
- качество самого ресурса (играет роль количество страниц, их наполнение);
Особенностью PageRank (PR) является то, что он определяется не для всего сайта, а для страниц и при учете внешних ссылок не учитывается текст ссылки - эти два принципа отличают его от показателя ТИЦ. Алгоритмы поисковой системы Google, в основном ориентированы на проверку качества ресурса, нежели на его внешние показатели и это можно объяснить тем, что в процессе развития интернета определение значимости ресурса с помощью уровня цитируемости неявно привело к манипуляциям этими показателями. Как следствие, сами по себе они перестали отображать истинный уровень качества ресурса, однако в применении с остальными алгоритмами, основанными на других показателях, получается результат максимально соответствующий общему качеству ресурса.
canon 550d 18 55