Статистика по операторам колдунщика Яндекса

Вот так по нашей массе запросов колдунщик Яндекса “любит” вставлять разные операторы (в % относительно &):

&		100%
&/(-2 4)	8.813
&/(-1 3)	9.914
&/(1 1)		1.784
&/(0 0)		0.035
&&/(-7 7)	15.212
&&/(-3 3)	14.705
&&		6.714
!!%		0.035
! 		0.699

Колдунщик Яндекса

Тут Professor недавно заметил у себя странные рефереры. Рефы были со страниц подсветки “найденных слов” Яндекса. Например, ищем Яндексе реклама в интернете, ссылка на “Найденные слова” выглядит как hghltd.yandex.ru/yandbtm?url=http://www.promodo.com/index-ru.html&text=реклама в интернете&reqtext=(реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6&dsn=70&d=3153694 – в ней есть параметр reqtext, который переводится как (реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6
Возникла мысль, что это реальный запрос, который отрабатывается вместо введенного, т.н. “колдунщик”. Нечеткий поиск, расстояния, веса.
Вот то, что после :: – похоже на вес слова в запросе. Например, в данном случае вес стоп-слова – ноль, а если бы был запрос реклама в, то стоп-слово имело бы ненулевой вес.
Я пробил 30 слов разных весов, получилось похоже на то, что вес~1/(число найденных страниц). Плюс-минус полпорядка 🙂 При этом точность была в пределах 0.3 порядка на не очень часто спрашиваемых словах, а на стоп-словах и очень частотных словах (напр. web, www) она прыгала сильно. Возможно, это с неточностью показа числа найденных страниц переплелось.
Короче, вес, видимо.
Он ограничен сверху – для “очень редких” запросов (лоренциан, гуано) = 2063133498.
Однако выдача немного не та, что на исходном запросе. По крайней мере у меня отличается, когда я смотрю последние сайты из 50, часто отличается… Хотя слабо очень.
Если вбить “заколдованный” запрос, и поменять веса ручками, то выдача не меняется. Он его переколдовывает обратно, блин! 🙂 А вот если поменять расстояние между словами – их не переколдовывает.
Яндексовские операторы:

пробел или & логическое И (в пределах предложения)
&& логическое И (в пределах документа)
/(n m) расстояние в словах (-назад вперед)
&&/(n m) расстояние в предложениях (-назад вперед)

Но интереснее – как он переколдовывает.

Слово лоренциан переколдовал так:
(лоренциан::2063133498 &/(0 0) !!%лоренциан::2063133498) – т.е., поиск на нулевом расстоянии между словами. Т.е., как бы усилено влияние самого слова, что ли…
А уже гуано колдует как гуано::2063133498.

Если стоп-слово одно или одно из двух в запросе, оно колдунщиком учитывается с восклицательным знаком, а если одно из трех – нулевой вес ставится. Если два стопслова и два нормальных – учитываются.

Такое впечатление, что колдунщик устойчивые словосочетания понимает… Но как-то странно.
напольные покрытия => (напольные::78746 &&/(-7 7) покрытия::21744)//6 – поиск в пределах 7 предложений,
новый год => (новый::532 &/(-1 3) год::502)//6 – поиск в пределах нескольких слов от год новый до новый () () год,
офисная мебель => (офисная::16909 & мебель::5321)//6 – без расстояния в одном предложении…

Все-таки не особо он понимает устойчивые выражения. Тогда “новый год” он бы искал по фразе. Может, просто с частотностью каждого из слов связано?

Иногда переставишь слова местами, а он их по-другому колдует:
аренда квартир => (аренда::10297 & квартир::5104)//6,
квартир аренда => (квартир::5104 &&/(-3 3) аренда::10297)//6 – явно не устойчивое словосочетание, и начинает сразу искать в пределах 3 предложений… Но вот для пар существительно – прилагательное это не работает. А только существительное – существительное.

И так-то не всегда получается – строительство домов и домов строительство одинаково переколдовывает…

А то иногда переставляешь слова в запросе – и он там расстояния между ними вставляет… Например синтаксис язык запросов яндекса переколдовывает через & , а язык запросов яндекса синтаксис – синтаксис отделяет &&(-7 7). И так далее.

А то еще и от падежей зависит! синтаксис языка запросов яндекса (не язык!) – переколдовал иначе, яндекс отделил &(-2 4), т.е., в одном предложении… Все-таки устойчивые фразы он как-то понимает…

Нет, что-то очень хитрое это…

У кого какие мысли?
_____________
PS ссылка на панель Links – для показа Евгений ТрофименкоОпубликовано Рубрики SEO и поисковикиМетки , 34 комментария к записи Колдунщик Яндекса