Колдунщик Яндекса

Тут Professor недавно заметил у себя странные рефереры. Рефы были со страниц подсветки “найденных слов” Яндекса. Например, ищем Яндексе реклама в интернете, ссылка на “Найденные слова” выглядит как hghltd.yandex.ru/yandbtm?url=http://www.promodo.com/index-ru.html&text=реклама в интернете&reqtext=(реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6&dsn=70&d=3153694 – в ней есть параметр reqtext, который переводится как (реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6
Возникла мысль, что это реальный запрос, который отрабатывается вместо введенного, т.н. “колдунщик”. Нечеткий поиск, расстояния, веса.
Вот то, что после :: – похоже на вес слова в запросе. Например, в данном случае вес стоп-слова – ноль, а если бы был запрос реклама в, то стоп-слово имело бы ненулевой вес.
Я пробил 30 слов разных весов, получилось похоже на то, что вес~1/(число найденных страниц). Плюс-минус полпорядка 🙂 При этом точность была в пределах 0.3 порядка на не очень часто спрашиваемых словах, а на стоп-словах и очень частотных словах (напр. web, www) она прыгала сильно. Возможно, это с неточностью показа числа найденных страниц переплелось.
Короче, вес, видимо.
Он ограничен сверху – для “очень редких” запросов (лоренциан, гуано) = 2063133498.
Однако выдача немного не та, что на исходном запросе. По крайней мере у меня отличается, когда я смотрю последние сайты из 50, часто отличается… Хотя слабо очень.
Если вбить “заколдованный” запрос, и поменять веса ручками, то выдача не меняется. Он его переколдовывает обратно, блин! 🙂 А вот если поменять расстояние между словами – их не переколдовывает.
Яндексовские операторы:

пробел или & логическое И (в пределах предложения)
&& логическое И (в пределах документа)
/(n m) расстояние в словах (-назад вперед)
&&/(n m) расстояние в предложениях (-назад вперед)

Но интереснее – как он переколдовывает.

Слово лоренциан переколдовал так:
(лоренциан::2063133498 &/(0 0) !!%лоренциан::2063133498) – т.е., поиск на нулевом расстоянии между словами. Т.е., как бы усилено влияние самого слова, что ли…
А уже гуано колдует как гуано::2063133498.

Если стоп-слово одно или одно из двух в запросе, оно колдунщиком учитывается с восклицательным знаком, а если одно из трех – нулевой вес ставится. Если два стопслова и два нормальных – учитываются.

Такое впечатление, что колдунщик устойчивые словосочетания понимает… Но как-то странно.
напольные покрытия => (напольные::78746 &&/(-7 7) покрытия::21744)//6 – поиск в пределах 7 предложений,
новый год => (новый::532 &/(-1 3) год::502)//6 – поиск в пределах нескольких слов от год новый до новый () () год,
офисная мебель => (офисная::16909 & мебель::5321)//6 – без расстояния в одном предложении…

Все-таки не особо он понимает устойчивые выражения. Тогда “новый год” он бы искал по фразе. Может, просто с частотностью каждого из слов связано?

Иногда переставишь слова местами, а он их по-другому колдует:
аренда квартир => (аренда::10297 & квартир::5104)//6,
квартир аренда => (квартир::5104 &&/(-3 3) аренда::10297)//6 – явно не устойчивое словосочетание, и начинает сразу искать в пределах 3 предложений… Но вот для пар существительно – прилагательное это не работает. А только существительное – существительное.

И так-то не всегда получается – строительство домов и домов строительство одинаково переколдовывает…

А то иногда переставляешь слова в запросе – и он там расстояния между ними вставляет… Например синтаксис язык запросов яндекса переколдовывает через & , а язык запросов яндекса синтаксис – синтаксис отделяет &&(-7 7). И так далее.

А то еще и от падежей зависит! синтаксис языка запросов яндекса (не язык!) – переколдовал иначе, яндекс отделил &(-2 4), т.е., в одном предложении… Все-таки устойчивые фразы он как-то понимает…

Нет, что-то очень хитрое это…

У кого какие мысли?
_____________
PS ссылка на панель Links – для показа Евгений ТрофименкоОпубликовано Рубрики SEO и поисковикиМетки , 34 комментария к записи Колдунщик Яндекса

Яндекс.Маркет – версия для КПК

Пресс-релиз Яндекса о создании версии Я.Маркета для карманных компьютеров.
Видимо, предполагается, что в офлайновые магазины люди будут “во всеоружии” приходить:

«При выборе сложного товара не всегда рядом оказывается специалист, который понимает все детали. В этом случае можно обратиться к карточке модели в Яндекс.Маркете, — говорит Илья Положинцев, руководитель направления электронной коммерции компании „Яндекс“. — Если у вас в руках карманный компьютер с интернетом, вы получите совет, не отходя от полки».

Хотя если люди про интернет знают вообще, они все вопросы заранее выяснят… Только одни отрицательные эмоции получать с этим КПК – рассматривая в Маркете низкие цены по сравнению с той, по которой ты сейчас все равно купишь товар… 🙂
Кстати, и ссылки в pda-версии должны быть тогда на pda-ориентированные сайты…