Рейкьявик — новая поисковая платформа Яндекса
Ну так-то понятно, что по каждому пользователю возникает еще один параметр – "англоязычные ли сайты он ищет".
Т.е. если использовать наработанные методики с обучением, то уже на вход обучалке надо подавать не набор пар (запрос – результат), а набор троек (запрос – фактор языковых предпочтений – результат).
Я так понимаю, что это было бы слишком сильным изменением, если бы было так. Вряд ли это так.
Значит, просто формула делится на две половинки – одна для русскоязычных языковых предпочтений, другая – для западных. Интересно, откуда данные будут брать – это же нативных людей с запада брать нужно.
Ну, очевидно, что асессорских данных меньше и в формуле с англопредпочтениями будет адский адъ.
ЗЫ Кстати, странная должность Расковалова – что это еще за "отдел разработки качества поиска"? разрабатывают качество?
Интернет, 17 августа 2011 года. Яндекс запустил новую поисковую платформу — «Рейкьявик». Она учитывает языковые предпочтения пользователя. Теперь люди, которые чаще ищут англоязычные ресурсы, будут видеть в результатах поиска больше ссылок на них, и наоборот. Это первый шаг Яндекса в направлении персонализации поиска.
«По статистике Яндекса, большинство пользователей предпочитают ответы на родном языке. Но есть и те, кто ищет именно англоязычные ответы, — говорит Денис Расковалов, руководитель отдела разработки качества поиска. — Мы много экспериментировали, пытаясь найти наилучший способ удовлетворить потребности и тех, и других. В результате мы решили научить поиск учитывать языковые предпочтения пользователей и подстраиваться под них».
«Рейкьявик» обращает внимание только на запросы на английском языке. Он отфильтровывает латинскую транслитерацию русскоязычных запросов, адреса сайтов, ошибки раскладки клавиатуры и т.д. При этом сам англоязычный вопрос не всегда означает поиск такого же ответа, например, по запросам [beatles”> или [rothko”> человек может искать и русские сайты. «Рейкьявик» учитывает, часто ли пользователь открывает из результатов поиска веб-страницы на английском.
Информация о том, нужны ли пользователю англоязычные ресурсы, используется при ранжировании. И если нужны, человек видит среди первых результатов поиска больше ссылок на них. По данным «Рейкьявика», ответы на английском языке предпочитают около 8% пользователей Яндекса.
Ecли и подавать на вход тройку, то пользователь-запрос-результат.
А когда они из "запроса" сделали "запрос из региона", это тоже было слишком сильным изменением?
Ну пока из персональных данных про пользователя считаются только языковые предпочтения – это одно и то же.
-да, действительно, сделали. Значит, нормально и в общей формула описывать языковые предпочтения.
Жень, радикально хуже уже не станет, наверное. Из-за предсказуемо мизерного объема асессорской оценки в глубину и по НЧ мы уже имеем адский ад везде, кроме ВЧ/СЧ 🙂
Почти в 100% случаев я ищу в Яндексе что-то по английски лишь из спортивного интереса, за чем следует клик по "поискать в Google".