Стартовала «Интернет-Математика»

27.10.2011

Яндекс объявил начало очередного конкурса «Интернет - математика». В этот раз заданием будет являться предсказание релевантности по пользовательскому поведению. Для данных исследований Яндекс предоставляет уникальные данные: асессорские оценки документов и информацию о переходах на эти документы из результатов поиска поисковой системы.

Таким образом, набор данных будет содержать:

Различных запросов - 30 717 251;

Различных документов - 117 093 258;

Пользовательских сессий – 43 977 859;

Всего строк (записей) – 340 796 067;

Оцененные асессорами документы (запрос – регион - документ) - 71 930;

Оцененные асессорами запросы (пара: запрос – регион) – 8 410.

Все бы хорошо, но среди входных данных нет коммерческих запросов. Кроме того, все данные анонимизированы, т.е. вместо конкретных значений используются уникальные числовые идентификаторы.

P.S. Главным условием призового места является предоставление подробного отчета, содержащего описание методики, используемой для предсказания оценок релевантности. Что интересно – отчет должен быть настолько подробный, чтобы можно было использовать эту методику без ее автора. Так что, если «Интернет-математика» заменить на «Алло, мы ищем таланты», то, видимо, ничего не измениться…

P.P.S. Как видно Яндекс все активнее развивает кластер поведенческих факторов ранжирования. Так что эта новость должна побудить людей, занимающихся поисковым продвижением сайта, активнее следить за удовлетворенностью пользователей на сайте и представлением его описания в SERP.