Есть над чем подумать

На “обгони-блоге” 🙂 наткнулся на ссылочку на ценный туториал, посвященный синтаксису запросов Яндекса, размещенный в незапамятные времена (месяц назад) в ЖЖ-комьюнити “кубка Яндекса”.
Меня употребление этих закорюк в синаксисе никогда особо не прикалывало, тем более я как изначально в его полезности разочаровался когда-то, так и не пользовался.
Но тут нашел интересное про принципы сортировки пи исключениях:

В идеале, сортировка результатов по запросу ‘компьютер ~ intel’ должна быть такой же, как и по запросу ‘компьютер’. Но это, увы, совсем не так. Если в запросе есть оператор исключения, порядок результатов тут же значительно изменится, даже если исключается несуществующее слово: сравните ‘компьютер ~ пывпывзпоцзукшпо’ и ‘компьютер’
Интересно, что оператор исключения создаст новый принцип сортировки, другой, но внутренне очень хорошо организованный — некую новую точку отсчета. Так, результаты ‘компьютер ~ пывпывзпоцзукшпо’ и ‘компьютер ~~ кракозебра’ идентичны, а запрос ‘компьютер ~~ #url=”www.compress.ru*”‘ действует идеально, убирая этот сайт с третьей позиции и оставляя в сохранности порядок всех остальных. Но! только относительно уже нового принципа сортировки.
Отдельно замечу, что оператор ‘-‘ тоже создает новый (отличающийся от первых двух) принцип сортировки и тоже внутренне логичный: ‘компьютер -фусуишвсонре’, ‘компьютер -кракозебра’ и ‘компьютер -vmware’.
Почему вдруг результаты начинаются сортироваться по-новому, не знает даже Яндекс: «Оба запроса (с ‘-‘ и ‘~~’) приводят к одному и тому же набору документов с точностью до ответов серверов в кластере. Другое дело, списки отранжированы по-разному. Однако в документации ничего не говорится об упорядочивании документов».

Еще забавно про многократное употребление всяких знаков, типа !!

Есть над чем подумать: 5 комментариев

  1. Обалдеть, а это вообще мимо меня прошло, знал только, что Рамблер так умеет:

    Транслитерация
    Какая разница между словами «хоровод» и «xopoвog»? Она почти не видна, но первое слово написано по-русски, а во втором только одна русская буква — ‘в’, остальные же написаны латинским шрифтом. Яндекс учитывает «взаимозаменяемость» некоторых английских и русских букв, поэтому:
    1. Оба запроса дадут почти на 100% одинаковые результаты: ‘хоровод’ и ‘xopoвog’
    2. Оба запроса найдут страницы как с русским «хороводом», так и составленным частично из английских букв.

    Следующие буквы взаимозаменяемы (полужирным выделены английские): e – е – ё, a – а, В – В (только прописные), c – с, e – е, g – д (только строчные), k – к, n – п (только строчные), o – о, p – р, u – и (только строчные), x – х, y – у. Кроме того, для Яндекса одинаковы два пробела — обычный и т. н. «неразрывный».

    Яндекс «транслитерует» слова, в которых есть хотя бы одна русская буква (noдapok)
    Яндекс НЕ транслитерует слова: 1) в которых все буквы английские: ‘nogapok’ (включая и слова, состоящие из одной буквы: ‘мне хорошо c тобой’); 2) в которых есть хотя бы одна цифра: ‘подарок1’ и ‘nодарок1’.

Комментарии запрещены.