А щастье было так возможно…

Как сказано в статье Ильи Сегаловича про поиск Яндекса, “на стадии индексации подавляются множественные вхождения запросов, предназначенные для накачки рел-ти” или типа того.
Сначала я забыл про это “на стадии индексации”. Потом до следующего утра думал, что вот, в руках алгоритм Яндекса – не терпелось опробовать. 🙂
Но не вышло. На стадии индексации вырезаются.
***
Что хотел сделать? В “подсветку”, как известно, передается заколдованный запрос пользователя. И id документа (d). И еще что-то (ds).
А зачем туда передавать заколдованный запрос, что, разве нельзя тупо подсветить все слова запроса в документе? Я по определению думал, что должны подсвечиваться все слова – даже не тестил никогда. Потом обалдел, когда увидел, что подсвечены не все слова! Тут и понял, что подсветка идет по найденным пассажам. Т.е., подсветка работает сродни поиску, по тому же алгоритму. Для этого и переколдованный запрос передается.
Сначала подумал, что часть документа выбрасывается как “переоптимизированная”. Но нет, при переформулировании запроса можно добиться подсветки любого словосочетания. Так же при изменении “мягкости” можно тоже подсветить все.
Отличный инструмент получается – что подсвечено, то Яндекс учитывает при ранжировании. А неподсвеченные слова – бесполезны. А если словосочетание обязано быть подсвеченным по операторам контекста, но не подсвечивается – значит, оно вырезано как спаммерское (таких примеров, правда, не видел пока).
Я-то что думал. Ведь при подсветке Яндекс забирает страницу заново с сервера… А ведь ее можно поменять и снова подсветить… И так понять правила “вырезания переоптимизации”. 🙂
Но увы.
Поигрался изменениями. Забавно, Яндекс конец предложения считает только, если после точки слово начинается с большой буквы, а если с маленькой – не считает… В общем, о разделителях можно узнать.
***
Примеров спама с тупыми перечислениями слов запроса напостите, плиз, кому не лень. 🙂

А щастье было так возможно…: 9 комментариев

  1. Жень, я как бы давно с этим столкнулся. Была у меня страница, которая упорно не лезла в выдачу подсовывая вместо себя другую – хотя вроде и ссылки на первую и вИЦ больше по уму и релевантность самой страницы вроде больше.

    А потом залез в подсветку – а там… В общем путем проб и ошибок поправился.

  2. Ан нет, ты смотри ж – опять вылезла… Елы-палы блин ну сколько можно…

  3. Ну еще Яндекс не любит подсвечивать слова в повторяющихся элементах сайта…

  4. Да, действительно. И, кстати, по запросу "Секционные ворота" кусок в меню тоже не подсвечивается.
    http://hghltd.yandex.ru/yandbtm?url=http://www.vestavorota.ru/&text=Секционные ворота&reqtext=(Секционные::2154871 & ворота::11650)//6&dsn=194&d=2706367
    -но в сниппете страницы (14 место) выводится кусок от меню! "Противопожарные двери и ворота Стальные двери Секционные ворота Сдвижные ворота Подъемно-поворотные ворота Распашные ворота"

  5. Не совсем чистый примерчик, но видно, что левая навигация обделена вниманием…

    В последнем пункте (Автоматика для ворот) подсветка есть.

    А еще есть подсветка в тексте, который виден только при наведении мыша на ссылку с обработкой события (см. заголовки в правой колонке).

  6. Убрать бы им "лишние" слова "ворота", "контрастность" которых в 100 раз ниже "секционные"…
    Плюс в нужных местах точек наставить. Тогда бы поднялись бы до места очень хорошего (в троечку)…

    А с таким расстоянием в словах как от первого "сдвижные" до первого "ворота" слов немеряно (например)…..

  7. не понятно только с левым меню
    только там "ворота" не подсвечены
    все остальные не подсвеченные "ворота" закрыты от индексации
    (наверное чтоб за применяемый скрытый текст не побанили)

Комментарии запрещены.