Колдунщик Яндекса

Тут Professor недавно заметил у себя странные рефереры. Рефы были со страниц подсветки “найденных слов” Яндекса. Например, ищем Яндексе реклама в интернете, ссылка на “Найденные слова” выглядит как hghltd.yandex.ru/yandbtm?url=http://www.promodo.com/index-ru.html&text=реклама в интернете&reqtext=(реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6&dsn=70&d=3153694 – в ней есть параметр reqtext, который переводится как (реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6
Возникла мысль, что это реальный запрос, который отрабатывается вместо введенного, т.н. “колдунщик”. Нечеткий поиск, расстояния, веса.
Вот то, что после :: – похоже на вес слова в запросе. Например, в данном случае вес стоп-слова – ноль, а если бы был запрос реклама в, то стоп-слово имело бы ненулевой вес.
Я пробил 30 слов разных весов, получилось похоже на то, что вес~1/(число найденных страниц). Плюс-минус полпорядка 🙂 При этом точность была в пределах 0.3 порядка на не очень часто спрашиваемых словах, а на стоп-словах и очень частотных словах (напр. web, www) она прыгала сильно. Возможно, это с неточностью показа числа найденных страниц переплелось.
Короче, вес, видимо.
Он ограничен сверху – для “очень редких” запросов (лоренциан, гуано) = 2063133498.
Однако выдача немного не та, что на исходном запросе. По крайней мере у меня отличается, когда я смотрю последние сайты из 50, часто отличается… Хотя слабо очень.
Если вбить “заколдованный” запрос, и поменять веса ручками, то выдача не меняется. Он его переколдовывает обратно, блин! 🙂 А вот если поменять расстояние между словами – их не переколдовывает.
Яндексовские операторы:

пробел или & логическое И (в пределах предложения)
&& логическое И (в пределах документа)
/(n m) расстояние в словах (-назад вперед)
&&/(n m) расстояние в предложениях (-назад вперед)

Но интереснее – как он переколдовывает.

Слово лоренциан переколдовал так:
(лоренциан::2063133498 &/(0 0) !!%лоренциан::2063133498) – т.е., поиск на нулевом расстоянии между словами. Т.е., как бы усилено влияние самого слова, что ли…
А уже гуано колдует как гуано::2063133498.

Если стоп-слово одно или одно из двух в запросе, оно колдунщиком учитывается с восклицательным знаком, а если одно из трех – нулевой вес ставится. Если два стопслова и два нормальных – учитываются.

Такое впечатление, что колдунщик устойчивые словосочетания понимает… Но как-то странно.
напольные покрытия => (напольные::78746 &&/(-7 7) покрытия::21744)//6 – поиск в пределах 7 предложений,
новый год => (новый::532 &/(-1 3) год::502)//6 – поиск в пределах нескольких слов от год новый до новый () () год,
офисная мебель => (офисная::16909 & мебель::5321)//6 – без расстояния в одном предложении…

Все-таки не особо он понимает устойчивые выражения. Тогда “новый год” он бы искал по фразе. Может, просто с частотностью каждого из слов связано?

Иногда переставишь слова местами, а он их по-другому колдует:
аренда квартир => (аренда::10297 & квартир::5104)//6,
квартир аренда => (квартир::5104 &&/(-3 3) аренда::10297)//6 – явно не устойчивое словосочетание, и начинает сразу искать в пределах 3 предложений… Но вот для пар существительно – прилагательное это не работает. А только существительное – существительное.

И так-то не всегда получается – строительство домов и домов строительство одинаково переколдовывает…

А то иногда переставляешь слова в запросе – и он там расстояния между ними вставляет… Например синтаксис язык запросов яндекса переколдовывает через & , а язык запросов яндекса синтаксис – синтаксис отделяет &&(-7 7). И так далее.

А то еще и от падежей зависит! синтаксис языка запросов яндекса (не язык!) – переколдовал иначе, яндекс отделил &(-2 4), т.е., в одном предложении… Все-таки устойчивые фразы он как-то понимает…

Нет, что-то очень хитрое это…

У кого какие мысли?
_____________
PS ссылка на панель Links – для показа Евгений ТрофименкоОпубликовано Рубрики SEO и поисковикиМетки , 34 комментария к записи Колдунщик Яндекса

Яндекс.Маркет – версия для КПК

Пресс-релиз Яндекса о создании версии Я.Маркета для карманных компьютеров.
Видимо, предполагается, что в офлайновые магазины люди будут “во всеоружии” приходить:

«При выборе сложного товара не всегда рядом оказывается специалист, который понимает все детали. В этом случае можно обратиться к карточке модели в Яндекс.Маркете, — говорит Илья Положинцев, руководитель направления электронной коммерции компании „Яндекс“. — Если у вас в руках карманный компьютер с интернетом, вы получите совет, не отходя от полки».

Хотя если люди про интернет знают вообще, они все вопросы заранее выяснят… Только одни отрицательные эмоции получать с этим КПК – рассматривая в Маркете низкие цены по сравнению с той, по которой ты сейчас все равно купишь товар… 🙂
Кстати, и ссылки в pda-версии должны быть тогда на pda-ориентированные сайты…

Яндекс-Директ сливает стоп-слова?

При задании в Директе запроса реклама на транспорте получаем в левой части выдачи:

реклама на транспорте 844
реклама в транспорте 25
гуп реклама и информация на транспорте 24
закон о рекламе на транспорте 22
наружная реклама на транспорте 21
регистрация рекламы на транспорте 21
эффективность рекламы на транспорте 21
размещение рекламы на транспорте 16
звуковая реклама в транспорте 16
реклама на транспорте санкт петербург 12
реклама в общественном транспорте 12

-это что же получается, они “на” и “в” считают наравне? Не должны ведь! Если задавать запрос реклама на – то все нормально вроде…
А как же при показе объявлений? Неужели так же?
Проверяем – запрос реклама и транспорт:

реклама на транспорте 844
реклама в транспорте 25
гуп реклама и информация на транспорте 24
закон о рекламе на транспорте 22
наружная реклама на транспорте 21
регистрация рекламы на транспорте 21
эффективность рекламы на транспорте 21
…..

Точно, и с другими запросами то же самое… Причем именно когда между двумя словами – стоп-слово…
Что за черт…

Belti.ru… Хомут, натягиваемый клещами.

Как-то был у меня клиент на дизайне и движке (CMS) от Сёмы.ру. CMS не позволяла тайтл и метатеги менять. Доступа к серверу по FTP нет. Изменения – за отдельные денюжки.
Ох, и намучился я тогда… Времени отъело и у меня, и у клиента – кучу.
Теперь опять предстоит, похоже.
Появился клиент на движке от Белти.ру. Та же ситуация, тайтлы не прописываются в CMS, даже шаблон поменять – на поклон к Белти изволь идти.
Но и отличие есть. Отличие в том, что Белти сама продвижением сайтов занимается (по крайней мере у Сёмы такого на сайте не написано).
Неужели ж они НЕ ЗНАЛИ, что тайтл и метатеги надо бывает изменять? Знали, конечно. А почему клиенту по умолчанию не поставили? Ответ очевиден.
Потому, что их “услуги оптимизации” тогда станут никому не нужны. Сейчас сайт клиента никак в принципе не может нормально ранжироваться. Хочешь не через задницу CMS? Изволь отстегнуть денежек.
Но такое вижу впервые – чтобы люди, имеющие представление о поисковых системах – СПЕЦИАЛЬНО ставили плохую систему управления контентом. А поставить по ТРИ ссылки с КАЖДОЙ СТРАНИЦЫ сайта клиента на себя любимых – не забыли…
Доколе, а?

От тех, кто не дорос до продвижения

В форуме Searchengines появилось объявление о работе от некоего Sam (который недавно интересовался индикатором тИЦ).
Объявление называется так: Для тех, кто перерос “оптимизацию”. В частности, там есть слова типа “не запятнавший себя подписанием Кодекса”. (Ссылка сам Кодекс).
Андрей Иванов даже по этому поводу написал разъяснения.
Мне бы со своей стороны хотелось бы попытаться перевести на более понятный язык некоторые требования к потенциальным сотрудникам – перевод вольный:

Требования к работнику Перевод на русский
– опыт поисковой оптимизации от 2-х лет Ну не можем же мы сказать, что лохов набираем!
– опыт внепоисковой трафикогенерации Навыки накрутки счетчиков, iframe-трафик и программы-кликеры
– опыт медиапланирования Сначала счетчики на сайте накрутим, а потом будем впаривать клиенту имиджевую рекламу
– английский желательно без словаря Будем заниматься партнерками в англоязычной порнухе – в словаре таких слов не пишут!
– кругозор в области интернет-маркетинга Будешь ходить по улице – оглядывайся по сторонам!
– опыт (желание, возможность, стремление) руководства коллективом Нужно набирать реферралов – таких умников, как ты сам
– не запятнавший себя подписанием Кодекса… Нужен дорвейщик и спаммер
Фрилансеров просьба не беспокоить! Зарплата $150 в месяц на полный день плюс уборка офиса

-все совпадения случайны 🙂

Очередные возможности языка запросов Яндекса

А.Садовский на форуме рассказывает об операторе нечеткого поиска в Яндексе и дает ссылку на Тезисы выступления на Диалоге-99.
Кажется, этот оператор (многословный запрос)//[0-100] не описан. Число явно на выдачу влияет, но что оно означает по смыслу…
Из тезисов больше удивило вот это:

Поисковый спам можно (довольно условно) разделить на две категории:

Спам по определенной тематике. Как правило, тематика совпадает с тематикой содержательной части документа. В этом случае автор спама, расчитывает на получение преимущества перед документами конкурентов на ту же тему. Можно считать такой вид спама не очень вредным, поскольку пользователь в этом случае получает примерно то, что искал.

Спам по “самым популярным словам в запросах”. В этом случае автор рассчитывает обеспечить максимально возможную популярность документу, пытаясь высоко позиционировать документ в выдаче поисковых систем по самым популярным запросам. При этом нередко сам документ абсолютно бессодержателен, поскольку практически ничего, кроме спама, он не содержит. Такие документы могут ухудшить качество поиска по самым популярным запросам до полной непригодности – если спам не подавлять.

В Яндексе обеспечена возможность подавлять спам избирательно.

-т.е., тематический спам по коммерческим запросам с редиректом – не считается таким уж серьезным. 🙂

Подсчет числа ссылок на странице

Очередная ссылка для перетаскивания на панель ссылок Links. При клике в алерте показывается общее число ссылок на данной странице, число яваскриптовых и нормальных: links

То же самое, но отдельно показывается число внутренних и внешних ссылок: links2 (у меня из панели опять не работает…)
Кстати, ссылки, напечатанные из яваскрипта как document.write(“< a href....< /a >“) (в частности, счетчики) оно принимает за нормальные ссылки.

Реклама на WebPlanet-е… Ну очень скромная!

После большого перерыва зашел на Вебпланету, на какую-то из внутренних страниц.
Увидел я там рекламку (графический блок в тексте), которую сначала принял за иллюстрацию и внимательно на нее посмотрел (а хитрый ход, а?).
Подумал – как ведь хорошо, не мозолят глаза рекламой, вот молодцы!
И кликнул.
И ссылка открылась в ифрейме!
Гы-гы. 🙂
Наверное, никто не заметил до сих пор – все равно на такие ссылки никто не кликает… 🙂 А реклама магазина hitmart – та вообще ошибку 500 дает, в том же фрейме…
Все, реклама уже никому не нужна. 🙂

Хотлог встал на путь исправления?

Сегодня письмо от Хотлога пришло:

Добрый день!

По многочисленным пожеланиям наших пользователей, мы изменили код счетчика системы Интернет-статистики HotLog, теперь он не содержит таблиц и состоит из одной картинки.
Для замены счетчика на Вашем сайте воспользуйтесь ссылкой “код счетчика” в Вашей учетной записи на www.HotLog.ru.

С уважением,
HotLog Support Team

-хотя я такие письма автоматически убиваю, даже не смотря в текст, сейчас решил посмотреть.
Правда, код не смотрел пока.

Яндекс: учет чисел в запросах

Когда-то в теме о дорвеях у меня возникло подозрение, что Яндекс числа в запросах как-то по-особому учитывает.
Например, он умеет приписывать и убирать нолики справа: по запросу 038 94 Яндекс выделяет болдом (и ищет, соотв.) по числам 38 и 094 в том числе. Еще можно БК 0010 поискать.
Но и это еще не все!
Яндекс умеет убирать пробел между числами, если первое число из одной цифры. По запросу 7(пробел)110 выдаются страницы про 7110. А если давать запрос 71(пробел)10 – все как и должно быть. Причем если во втором числе не 3 цифры, а одна или две – не сливает! 🙂
PS
Нет, это даже работает, когда первое число длиннее одной цифры! Главное, чтобы второе было длинным.
Интересно, как это в Директе отображатеся… По ходу, в статистику попадает “конечный” запрос – он пишет Запросов за месяц: 7100 — 3235.