Про инсайдера из Yandex

Тут сегодня тема на форуме поднялась – про то, как люди выявили клоны е-магазина и стукнули в Яндекс, а там, как оказалось, работает материально заинтересованное лицо. И это лицо вынесло магазин жалобщиков из индекса. 🙂
Мораль первая – стучать надо от лица кого-нибудь другого, лучше – от лица конкурентов.
Вообще, описано достаточно правдоподобно, я купился и пошел искать.
Мне как бы интересно было, что же такого на сайте этого инсайдера есть. Что и как сотрудник Яндекса прооптимизирует со своей точки зрения…
По истории с pacan.ru я помнил, что Рамблер индексирует whois с сайта new.nameserver.ru, поэтому поискал слово yandex-team по этому сайту.
Вылезло 10 сайтов, последний – bigsale.ru зарегистрирован на yandex-team – и это единственный сайт, у которого регистрационное мыло изменено – вот он, голубчик!
Поиск по второму мылу дает кроме bigsale.ru еще и bigtv.ru, big-tv.ru. Дальше искать лениво было.
Особенностей… вроде ничего особо интересного не нашел. Что забавно, “возможные варианты написания” названия модели (для собирания низкочастотников) и я сам тоже недавно придумал. И вот увидел у других 🙂
Еще забавно, что перечисления моделей в в тайтле человек делает сначала через запятую, а потом отдельно без запятых. И на каждой странице присутствует ссылка “на себя” с теми же словами. А вообще оптимизировано минимально. И откуда там столько хостов берется??? На bigtv 800 хостов к этому моменту.

Мастерхост – уроды…

Сегодня от 6 утра получил более 2000 писем от скрипта заказа магазина. Пустых заказов. разумеется, с попытками взлома.
Я помнил о том, что они предлагали проверку скриптов сканером XSpider компании Positive Technologies, даже письмецо прислали:

SUBJECT: Новая бесплатная услуга от Мастерхост

Спешим сообщить вам о том, что с 19-го октября сего года вводится в эксплуатацию новая бесплатная услуга по тестированию виртуальных площадок на предмет выявления известных и потенциальных уязвимостей в программном обеспечении интернет-проектов.

Тестирование производится самым интеллектуальным в мире сканером XSpider компании Positive Technologies.

Пресс-релиз о сотрудничестве: http://masterhost.ru/press/release/20041018/.

В случае обнаружения каких-либо уязвимостей в программном обеспечении ваших проектов, вы получите письмо-уведомление, в котором будут перечислены все найденные уязвимости и рекомендации Positive Technologies по их ликвидации.

Тестирование производится со специально установленных серверов на площадке .masterhost без какого-либо внутреннего проникновения на тестируемые сайты.

XSpider производит попытки взлома, осуществляет всевозможные атаки, SQL-инъекции, подбирает пароли и производит другие действия, присущие интернет-злоумышленникам. При этом сканер не наносит какого-либо вреда вашим интернет-проектам, даже если ему удается получить полный контроль над сайтом, но вы можете обнаружить следы его работы в логах, сообщениях о неудачных попытках проникнуть на сайт и в других сообщениях ПО вашего сайта или поддерживающих систем .masterhost.

Мы надеемся, что предлагаемый сервис по-настоящему поможет вам предупредить потерю информации, кражу секретных данных и другие неприятные последствия от действий интернет-злоумыленников.

Ничего себе бесплатная услуга! Звоню им. Говорю – я эту х##ню НЕ ЗАКАЗЫВАЛ!!! Какого хрена оно нарушает работу мою и магазина???
Говорят – а вот мы вам письмо слали. Вы могли ведь и отказаться.
Я говорю – что за х…, я НЕ ЗАКАЗЫВАЛ ЭТО!!!
Говорят – по умолчанию условием нашего хостинга (НЕ ЧИТАЛ Я ТАКИХ УСЛОВИЙ НИГДЕ!!!) является то, что этот сканер включен.
***
Ну не уроды, а? Нет, неужели где-то в этом письме написано, что по умолчанию все обязаны тестироваться??? Нормальный человек может понять, что эта “бесплатная услуга” – обязательна?!!

Изменяется время удаления доменов из Реестра RU

Ру-центр меняет время удаления доменов из реестра с 12 утра на 19-30 вечера:

С 10 ноября 2004 года Технический центр домена RU, с целью снижения нагрузки в рабочие часы, изменяет время удаления доменов из Реестра. Теперь процедура удаления доменов будет запускаться в 19:30 (MSK), а не в 12:00 (MSK), как это было до сих пор.

-достали видать, его борцы за домены… 🙂
Видимо, они думают, что после работы людей будут выгонять от компьютеров и они не смогут бороться за домены. 🙂

Чудеса с Яндексом

С утра прихожу – вижу, народу на сайт прибежало раза в 3 больше, чем обычно. Лезу в Хотлог. А там написано, что ко мне заходили много с Яндекса по хорошему однословному запросу 🙂
Смотрю в выдачу – а меня там нет. А место в Мейловском рейтинге в течение дня стабильно – значит, ничего не меняется, народ идет с той же скоростью… Но откуда? И эти заходы по однословным запросам все появляются, правда, меньше гораздо…
А сейчас вижу – кажись, Яндекс субдомены больше не сливает! И даже больше того – отдельные страницы с субдомена показываются. Нашел по трехсловному запросу в выдаче 3 своих страницы – одну с основного домена, две других с субдомена.
Глазам не поверил, полез смотреть, не внесли ли субдомен в ЯК :), не заметив, что с него 2 страницы выдается…
Это объясняет общее увеличение трафика при падении позиций…
Но дождемся конца апдейта…

Кнопки Яндекса – невежливо получается…

Видимо, в результате изменений в Я.Каталоге произошло перемещение соурсов Яндекс-денежек.
Раньше все время кнопки грузились с http://yaca.yandex.ru/cycounter?имя-домена , и тут вчера я вижу – у меня все кнопки в показе экспайред-доменов не грузятся. А прошвырнулся по другим людям, которые Я.кнопки показывают – у них все нормально.
Сегодня зашел на место, где “получают денежку”. Там в src кнопки стоит http://www.yandex.ru/cycounter?имя-домена

Фак! Сначала люди кнопки понаставили, а потом – упс, и они показываться перестали. Мне-то что, шаблон сменил.
__
ЗЫ Честно сказать, я вчера, увидев на первом же сайте нормально показывающиеся кнопки, подумал, что меня зафильтровали (типа реферреры с links.obgon.ru чекали)…

Яндекс меняет морду и структуру каталога

На морде Яндeкca теперь другой рубрикатор каталога и дизайн другой немного. Что изменилось.
Не стало ссылок на внутренние разделы. Если ЯК влиял на поиск на основании своей цитируемости, это влияние уменьшится.
Появились ноые группы (учеба), также география по Москве (а что, 30-35% юзеров по статистике!) и ссылка на Маркет.
В рубриках показываются новости по теме. Пора начинать под них оптимизироваться 🙂
Что плохо: в категориях перестала показываться заветная цифирка, определяющая id категории для ограничения по поиску… Как хорошо, что я успел скачать их 🙂
Хотя все равно новые цифирки сопрем. Удобство перевешивает.
Ну и баги – поиск не работает, категории глубокие не показываются… Временно, видимо…

Какие домены-то освобождались сегодня, а?

Домены partners.ru, system.ru, wholesale.ru.
Обычный такой день, даже не вторник :), и такие домены.
Думаете, я за них не боролся? 🙂

Колдунщик Яндекса

Тут Professor недавно заметил у себя странные рефереры. Рефы были со страниц подсветки “найденных слов” Яндекса. Например, ищем Яндексе реклама в интернете, ссылка на “Найденные слова” выглядит как hghltd.yandex.ru/yandbtm?url=http://www.promodo.com/index-ru.html&text=реклама в интернете&reqtext=(реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6&dsn=70&d=3153694 – в ней есть параметр reqtext, который переводится как (реклама::1676 &/(-1 3) в::0 &/(-1 3) интернете::1313)//6
Возникла мысль, что это реальный запрос, который отрабатывается вместо введенного, т.н. “колдунщик”. Нечеткий поиск, расстояния, веса.
Вот то, что после :: – похоже на вес слова в запросе. Например, в данном случае вес стоп-слова – ноль, а если бы был запрос реклама в, то стоп-слово имело бы ненулевой вес.
Я пробил 30 слов разных весов, получилось похоже на то, что вес~1/(число найденных страниц). Плюс-минус полпорядка 🙂 При этом точность была в пределах 0.3 порядка на не очень часто спрашиваемых словах, а на стоп-словах и очень частотных словах (напр. web, www) она прыгала сильно. Возможно, это с неточностью показа числа найденных страниц переплелось.
Короче, вес, видимо.
Он ограничен сверху – для “очень редких” запросов (лоренциан, гуано) = 2063133498.
Однако выдача немного не та, что на исходном запросе. По крайней мере у меня отличается, когда я смотрю последние сайты из 50, часто отличается… Хотя слабо очень.
Если вбить “заколдованный” запрос, и поменять веса ручками, то выдача не меняется. Он его переколдовывает обратно, блин! 🙂 А вот если поменять расстояние между словами – их не переколдовывает.
Яндексовские операторы:

пробел или & логическое И (в пределах предложения)
&& логическое И (в пределах документа)
/(n m) расстояние в словах (-назад вперед)
&&/(n m) расстояние в предложениях (-назад вперед)

Но интереснее – как он переколдовывает.

Слово лоренциан переколдовал так:
(лоренциан::2063133498 &/(0 0) !!%лоренциан::2063133498) – т.е., поиск на нулевом расстоянии между словами. Т.е., как бы усилено влияние самого слова, что ли…
А уже гуано колдует как гуано::2063133498.

Если стоп-слово одно или одно из двух в запросе, оно колдунщиком учитывается с восклицательным знаком, а если одно из трех – нулевой вес ставится. Если два стопслова и два нормальных – учитываются.

Такое впечатление, что колдунщик устойчивые словосочетания понимает… Но как-то странно.
напольные покрытия => (напольные::78746 &&/(-7 7) покрытия::21744)//6 – поиск в пределах 7 предложений,
новый год => (новый::532 &/(-1 3) год::502)//6 – поиск в пределах нескольких слов от год новый до новый () () год,
офисная мебель => (офисная::16909 & мебель::5321)//6 – без расстояния в одном предложении…

Все-таки не особо он понимает устойчивые выражения. Тогда “новый год” он бы искал по фразе. Может, просто с частотностью каждого из слов связано?

Иногда переставишь слова местами, а он их по-другому колдует:
аренда квартир => (аренда::10297 & квартир::5104)//6,
квартир аренда => (квартир::5104 &&/(-3 3) аренда::10297)//6 – явно не устойчивое словосочетание, и начинает сразу искать в пределах 3 предложений… Но вот для пар существительно – прилагательное это не работает. А только существительное – существительное.

И так-то не всегда получается – строительство домов и домов строительство одинаково переколдовывает…

А то иногда переставляешь слова в запросе – и он там расстояния между ними вставляет… Например синтаксис язык запросов яндекса переколдовывает через & , а язык запросов яндекса синтаксис – синтаксис отделяет &&(-7 7). И так далее.

А то еще и от падежей зависит! синтаксис языка запросов яндекса (не язык!) – переколдовал иначе, яндекс отделил &(-2 4), т.е., в одном предложении… Все-таки устойчивые фразы он как-то понимает…

Нет, что-то очень хитрое это…

У кого какие мысли?
_____________
PS ссылка на панель Links – для показа Евгений ТрофименкоОпубликовано Рубрики SEO и поисковикиМетки , 34 комментария к записи Колдунщик Яндекса

Яндекс.Маркет – версия для КПК

Пресс-релиз Яндекса о создании версии Я.Маркета для карманных компьютеров.
Видимо, предполагается, что в офлайновые магазины люди будут “во всеоружии” приходить:

«При выборе сложного товара не всегда рядом оказывается специалист, который понимает все детали. В этом случае можно обратиться к карточке модели в Яндекс.Маркете, — говорит Илья Положинцев, руководитель направления электронной коммерции компании „Яндекс“. — Если у вас в руках карманный компьютер с интернетом, вы получите совет, не отходя от полки».

Хотя если люди про интернет знают вообще, они все вопросы заранее выяснят… Только одни отрицательные эмоции получать с этим КПК – рассматривая в Маркете низкие цены по сравнению с той, по которой ты сейчас все равно купишь товар… 🙂
Кстати, и ссылки в pda-версии должны быть тогда на pda-ориентированные сайты…

Яндекс-Директ сливает стоп-слова?

При задании в Директе запроса реклама на транспорте получаем в левой части выдачи:

реклама на транспорте 844
реклама в транспорте 25
гуп реклама и информация на транспорте 24
закон о рекламе на транспорте 22
наружная реклама на транспорте 21
регистрация рекламы на транспорте 21
эффективность рекламы на транспорте 21
размещение рекламы на транспорте 16
звуковая реклама в транспорте 16
реклама на транспорте санкт петербург 12
реклама в общественном транспорте 12

-это что же получается, они “на” и “в” считают наравне? Не должны ведь! Если задавать запрос реклама на – то все нормально вроде…
А как же при показе объявлений? Неужели так же?
Проверяем – запрос реклама и транспорт:

реклама на транспорте 844
реклама в транспорте 25
гуп реклама и информация на транспорте 24
закон о рекламе на транспорте 22
наружная реклама на транспорте 21
регистрация рекламы на транспорте 21
эффективность рекламы на транспорте 21
…..

Точно, и с другими запросами то же самое… Причем именно когда между двумя словами – стоп-слово…
Что за черт…