Ненавижу.
Щито такое мягкость: в переколдовке запросов, которая частично описывалась в статье Сегаловича и Ко Яндекс на РОМИП-2004, был параметр “мягкость” – число через // в конце запроса, которое отражало долю веса кворума, которую найденная фраза могла не добрать и пройти кворум, т.е. найтись.
Это все было описано в хелпах (http://help.yandex.ru/search/?id=481939 на archive.org):
(запрос из нескольких слов)//N, где N — число от 1 до 100.
При расчете релевантности документа могут быть сочтены релевантными пассажи, где есть только часть слов запроса, тем меньшая, чем больше N (по умолчанию N=6). В результатах поиска такие документы помечены как «нестрогое соответствие». Подробнее см. раздел «”Фильтрация” по кворуму» в статье «Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс».
Это я полез туда убедиться, что у меня не глюк.
У меня не глюк – сейчас в хелпе Яндекса этого нету.
Т.е., удалили.
Самый интересный вопрос – а кой я полез в этот хелп? А вот…
У меня есть пробивалка “весов” слов, я по ней предполагал смотреть когда чего пересчитывают, веса пересчитывались каждый апдейт, но слабо. Иногда бывали очень сильные пересчеты весов.
Работала она обычно: задавался запрос вида (искомоеслово jsbcfebe::WT)//50, при этом если результат находился, вес искомогослова выше WT, нет – ниже. Интервал делился пополам, находился вес слова с точностью до 1.
И вот в какой-то момент оно мне начало показывать, что типа веса нулевые. Из-за какой-то там ошибочки.
Ошибочек оказалось две:
1. одна – это то, что мое “несуществующее слово” вида abrakadabra23123234 (буквыцифры) теперь не работает – яндекс в любом случае пишет, что ничего не найдено, видимо, как-то чекает конструкцию – просто abrakadabra из букв пашет нормально.
2. вторая – это то, что мягкость отменили… С мягкостью 50 стало искаться так же, как и без мягкости. Поэтому все диапазоны весов оказались заведомо не находящимися, при смене мягкости //50 на дефолтную //6 все веса огрублюется в 1396 раз, и границы диапазонов тоже сместились.
По моей базе видимое мне обнуление весов произошло примерно 1 июня. Не знаю – возможно мягкость отменили не тогда, а тогда абракадабру с цифрами отменили…
Но я сразу не полез смотреть на мягкость. Включил перепробивку (1440 слов, раз в минуту по слову) заново, изменив абракадабру.
А надо сказать, что слова в базе были подобраны так, чтобы был разброс: и слова с большими весами (десятки тыщ-миллионы), и с маленькими (300-800) вперемешку.
Только смотрю: при перепробивке все веса получаются в размере 200-400… А разброс в весах должен быть большой.
И случайно проверил мягкость…Не работает.
Полез в хелпы – удивился – нету. Не поверил глазам, полез в вебархив – нашел.
Проверяйте:
с мягкостью 50:
(скачивать aaaaddddeee::173)//50 – находится
(скачивать aaaaddddeee::174)//50 – нету
с мягкостью 6:
(скачивать aaaaddddeee::173)//6 – находится
(скачивать aaaaddddeee::174)//6 – нету
по дефолту:
(скачивать aaaaddddeee::173) – находится
(скачивать aaaaddddeee::174) – нету
Цуки. Отрубают потихоньку возможности-то… Не хотят, чтобы мы слишком точно считали…
Ну ничего, будем считать неточно. Хорошо, что у меня собранные точные данные сохранились. Веса-то мне не нужны, неточно тоже будем считать…
Попозже выложу сравнение старых и новых весов.