Алгоритмы ссылочного или анкорного ранжирования

Максим Михайличенко
Максим Михайличенко
Руководитель компании
18.04.2013

До 1998 года все, что было у в руках людей, которые пытались сделать поисковые машины, это были тексты документов.

Интернет быстро развивался и постепенно стал основным местом для поиска информации. Кроме того, благодаря структуре интернета, в нем сразу были ссылки. Т.е. сразу возможно было ссылаться с одного документа на другой, при этом ссылаться с некоторым текстом.

Какими же свойствами обладают ссылки:

1) Обычно, это хорошее описание документа, которое очень часто выражено другим языком, нежели тот, на котором написан документ.

2) Ссылки обладают интересным свойством подтверждающим важность документа. Имеется ввиду, что если пользователь ищет что-то про запрос, то вероятнее всего ему будет приятнее найти документ, на который больше всего ссылаются.

Как же учитывать ссылки?

По сути, оптимальным решением является тот же самый инвертированный индекс.

Т.е. поисковая машина берет массив входящих ссылок (их анкоры – текста ссылок) как единый текст. И уже к этому тексту она может применять аналоги алгоритмов ранжирования, о которых говорится в статье «Алгоритмы ранжирования текстов».

Если посмотреть на второй пункт в списке свойств ссылок, то становится понятно, здесь речь идет о Page Rank. Опять же, надо помнить, что если у текстовой релевантности и анкорной релевантности есть запрос, то page rank никак к запросу пользователя не относится.

P.S.: Автор надеется, что если читатель как-то связан с вопросами поискового продвижения сайта, то данная статья окажется для него полезной.