Кубик результатов поиска



Яндекс знает не только темы запросов, но и тематики популярных сайтов. Это знание помогает системе понимать тему запроса, про который ничего заранее не известно.

Кубик включается, когда для запроса уже сформированы результаты поиска, но ещё не показаны пользователю. Он смотрит, есть ли среди наиболее релевантных ресурсов, на которые поисковая система предложит перейти пользователю, известные ему сайты и к какой тематике они относятся. Например, если среди них есть несколько сайтов про недвижимость, кубик сообщит об этом решателю — тот будет знать, что может пригодиться ответ от Яндекс.Недвижимости. Когда в результатах поиска в достаточном количестве присутствуют ресурсы на разные темы, кубик рассчитывает вес каждой, основываясь на количестве сайтов, и передаёт данные в решатель.

Кубик качества

Некоторые запросы пользователи задают редко, и ответы на них есть лишь на нескольких сайтах. Например, название модели какой-нибудь непопулярной стиральной машины, которая уже снята с производства, но несколько штук ещё осталось в паре магазинов. В таком случае у поисковой системы недостаточно данных, чтобы отнести запрос или сайт к определённой тематике. Кубик качества следит за результатами поисков по сервисам и сообщает решателю, есть ли на одном из них ответ и насколько он точен. Если у параллельного поиска есть хороший ответ (например, предложение о продаже именно этой модели на Яндекс.Маркете), решателю этого будет достаточно, чтобы показать соответствующий колдунщик, даже если остальные кубики ничего не сообщили.

Решатель

Каждый из кубиков обрабатывает запрос независимо от ответов остальных кубиков, а затем передаёт данные в решатель (если они есть). На основании этих данных решатель подставляет соответствующие коэффициенты в формулу ранжирования колдунщиков. В формуле учитывается, какие из кубиков дали ненулевой ответ (например, если сработал кубик запросов, решатель, скорее всего, не будет добавлять в формулу данные от остальных) и к каким темам с каким весом относится запрос.

Система, которая ранжирует колдунщики, — самообучаемая, и ранжирование, основанное на данных от кубиков, не окончательное. Допустим, на запрос [бритни спирс] кубик переформулировок передал решателю, что это запрос с «музыкальным» весом — 0.6, «картиночным» — 0.3, а к теме «видео» относится с весом 0.1. Примерно то же самое передал кубик результатов поиска, а кубики запросов и качества ничего про этот запрос не выяснили. Основываясь на этих данных, решатель поставил колдунщик Яндекс.Музыки выше колдунщика Яндекс.Картинок, а колдунщик Яндекс.Видео решил не показывать. Затем система отслеживает — насколько популярны показанные колдунщики у пользователей. И если более популярный изначально оказался ниже, система перенесёт его на верхнюю позицию. А если колдунщик вовсе не пользуется спросом — может вообще не показывать его по этому запросу.


Дата добавления: 2015-12-17; просмотров: 22; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!