Что такое Page Rank?

Максим Михайличенко
Максим Михайличенко
Руководитель компании
19.10.2012
Наверное, каждый кто занимается поисковым продвижением сайта, когда-либо интересовался этим вопросом. Это мера важности документа в интернете, учитывающаяся большинством поисковых систем. Данный фактор не зависит от запроса. Page Rank – это вероятность случайного пользователя попасть на документ. Здесь имеется в виду, что чем больше ссылок стоит на документ, тем больше точек входа имеет этот документ. Причем, чем выше PR донора, тем выше вероятность пользователю оказаться на доноре и тем выше вероятность перейти по ссылке на страницу акцептор (в данном случае страницу, о PR которой мы говорим). При чем, чем меньше ссылок стоит на странице доноре, одна из которых на акцептор, тем больше вероятности, что пользователь перейдет именно на нужного нам реципиента. Далее все это высчитывает итеративно. Получается простая формула (естественно, в реальности все намного сложнее): PR(acceptor)= (1-d)+d*PR(donor 1)/С(donor 1)+…+d*(PR(donor n)/C(donor n) PR(acceptor) – PR акцептора; d – коэффициент затухания. Он берется из расчета, что пользователь больше не захочет переходить по ссылкам на доноре и решит осуществить иное действие (например, закроет браузер); PR(donor 1) – PR одного из доноров, ссылающихся на акцептор; C(donor 1) – количество ссылок на одном из доноров, ссылающихся на акцептор; Как видно из формулы, суммирование происходит по всем донорам. Понятно, что эта формула является очень грубой моделью и не учитывает множество факторов (например, принцип телепортации – случайный пользователь блуждающий по сети с некоторой вероятностью, может набрать адрес в строке браузера). Сегодня, более популярной является иная модель Page Rank, поэтому далее будет приводится объяснение с позиции времени, проведенном на документе. Наверное, автор этой статьи сейчас удивит многих читателей, сказав, что случайный пользователь изначально считается у поисковика стохастической величиной, т.е. его переход по какой-либо ссылке (или любое другое его действие) считается случайным событием. Таким образом, была придумана модель «блуждающей обезьянки». Всем страницам была роздана начальная «денежка», допустим она равна единице. После чего запустился итеративный процесс (непрерывный во времени). Наша обезьянка начинает случайным образом переходить по ссылкам. На каждой новой странице она проводить некоторое количество времени, после чего вновь переходит по ссылке. Поэтому, чем больше ссылок стоит на страницу, тем чаще там оказывается обезьянка. P.S. Page Rank достаточно важный фактор для поисковиков (например, они склонны более подозревать в поисковом спаме документы с маленьким PR). Но надо сказать, что т.к. эта величина никак не зависит от запроса, то ее влияние на ранжирование по конкретному запросу не так велико, как многие могут предположить.