Яндекс отменил подсветку и ID спектровых слов…

Это даже лучше, чем "с водой ребенка выплеснуть", приближается к "насрать себе на голову" и "самих себя высечь" ))

Предыстория: на следующий день после моего доклада яндекс сменил идентификаторы документов в выдаче – после этого спектровую примесь стало сложнее отличить от быстроробота.

Ссылка на презентацию доклада «Технология "Спектр" Яндекса и классификация веб-страниц» (это уже поправленная, после изменения идентификаторов на следующий день).

А сегодня следующий шаг – обнаружил, что:
1. Подсветка дополнительных расширяющих слов и многословных фрагментов исчезла.
2. Идентификаторы обычных документов и спектровой примеси стали одинаковыми.

Примеры:
по запросу пицца пропали выделения слов "доставка" и многословного фрагмента "на дом"
по запросу сузуки гранд витара доп. слова типа "фото, отзывы" больше не выделяются
по запросу казани много доп.слов типа "достопримечательнсоти, карта, недвижимость" больше не выделяются
ну и конечно, по продвижение сайта допслово "самостоятельно" у примеси seoshnic.ru уже не выделяется.

При отсутствии изменений в выдаче (примесь на тех же местах) идентификаторы сменились и подсветка исчезла.

Особенно прикольно то, что идентификаторы сменились без текстового апдейта. Вчера идентификаторы были из трех фрагментов и подсветка была, а сегодня из четырех и нет. Вчера все было, проверил по кешу.

Нет, ну понятно, что яндекс немножко борется )), но самим себе вредить – это жостко. ))

***
Почему "насрали на самих себя"? Потому, что подсветка в выдаче должна помогать пользователю. По крайней мере, поможет выбрать один из результатов по тому намерению пользователя, которое он поленился написать в запрос.

И ведь задача подсветки дополнительных слов – отдельная, ее надо было отдельно решать, тратить отдельно на это время. И специально подсвечивали только в пределах первой десятки.

И я понимал про пользу юзера, и поэтому так запросто делал доклад – я не верил, что юзеру сделают плохо из-за каких-то сеошников ) Это не должно было быть отменено в принципе.

А тут взяли и отменили 🙂
Тут, понятно, два варианта: либо ошибались весь год (подсветки СПЕКТРа), либо ошибаются сейчас. Виноваты в любом случае )))

***
Теперь высрался и хочу сказать яндексу небольшое спасибо.
Теперь благодаря яндексу получается, что у меня есть эксклюзивчик – база дополнительных слов и многословных фрагментов.

Раньше-то эти 6.5М запросов мог скачать любой и выяснить все то же самое, а теперь не может. ))

Теперь придется на этих расширяющих спектровых словах (по всем русским запросам, по-хорошему) сделать сервис 🙂

Яндекс.СПЕКТР сменил id документов, неожиданно за день )

24 и 25 ноября прошла 10я ашмановская конференция по оптимизации сайтов, на которой я планировал два, а сделал три доклада.
Первый – про технологию Спектр (презентацию скоро выложу, видео из профессиональной секции, как я понял, у них не бывает). Вторые два – в секции "парад технологий и сервисов", один про seo-CRM для небольших seo-компаний, которым не хочется для этого держать отдельного программиста, третий – про систему ссылочного продвижения "от меня" (сейчас находится в папке на tools, вот домен сменю и отдельно анонс сделаю).
***
Но я не об этом.
Значит, я в докладе и в презентации показывал, как отличать "спектровые" примеси – по идентификатору документа в XML.
Вчера, в момент доклада, было так:

у обычного результата doc id="49-*-*-*" (4 фрагмента)
у спектра doc id="49-*-*" (3 фрагмента, тот же первый фрагмент – 49)
у быстроробота doc id="53-*-*" (3 фрагмента, другой первый фрагмент)

А сегодня для спектровой примеси стало так:

у спектра doc id="52-*-*" (3 фрагмента, стал другой первый фрагмент – 52)

🙂
Проверил по своему кешу ХМЛ – так и есть.
Вчера у примесного ssve.ru по "продвижению сайтов" был ID 49-118-Z7725D3069AAE1668, а сегодня уже 52-3-Z7725D3069AAE1668. Забавно, еще и остальные фрагменты сменились, не только базу переименовали.
***
Интересно, зачем они это делают? И ведь какая срочность!
Чтобы никто не догадался и все попячились? 🙂
Смешно, чо.

PS внесу изменения в презентацию, попрошу выложить поправленную ))

Интернет.Обсоски

Внезапно!!!1
Стартовала новая «Интернет-математика»

Цель этого конкретного конкурса — предоставить всем желающим возможность провести исследования по предсказанию релевантности документов по пользовательскому поведению. Специально для конкурса Яндекс предоставляет уникальный набор данных — информацию о переходах на документы из результатов поиска и асессорские оценки релевантности этих документов.

-я тоже внезапно захотел поучастовать, я-то уже во второй раз собрался в конкурсе двухлетней давности поучаствовать – неожиданно осознал, что сервер же с 24 Гб есть. А тогда я понял, что ноут с одним гигом месяц будет считать, и забил на это временно.

Однако по новому конкурсу выяснились дополнительные детали:
http://imat-relpred.yandex.ru/datasets

Важнейшим условием участия в конкурсе является описание метода, с помощью которого было произведен результат (длиной от 150 до 700 символов) на английском (желательно) или на русском языке. Это описание предоставляется вместе с результатами при их загрузке. Организаторы оставляют за собой право аннулировать регистрацию участников, которые предоставляют бессмысленные или неинформативные описания своих результатов.
***
Одним из главных условий получения приза является предоставление полного технического отчета с описанием методики получения результата. Отчет должен содержать достаточно информации, чтобы результат можно было бы воспроизвести без участия самого участника предоставившего результат.

-бгг ))
неужели без отчота не получится померить качество по загруженным наборам для оценки?
вот это реально ахтунг. своих людей и мозгов не хватает?

PS Желаю, чтобы этот случай не лучшим образом сказался на эээ… чем там нынче модно? стоимости акций, да? доле трафикогенерации в рунете, да?

Жесть вообще. Они ищут таланты, бгг.

Яндекс: переоптимизированные тексты и открытие buki.yandex

Яндекс собрался давить переоптимизированные тексты и сейчас открыл БУКИ http://buki.yandex.ru/ – очевидно, пару недель потестируем, чо как.

Только пока что поиск на буках не пашет. Только морда поменялась.
Видать, скоро и поиск будет.

Рейкьявик – начинают персонализацию поиска, получается

Рейкьявик — новая поисковая платформа Яндекса
Ну так-то понятно, что по каждому пользователю возникает еще один параметр – "англоязычные ли сайты он ищет".
Т.е. если использовать наработанные методики с обучением, то уже на вход обучалке надо подавать не набор пар (запрос – результат), а набор троек (запрос – фактор языковых предпочтений – результат).
Я так понимаю, что это было бы слишком сильным изменением, если бы было так. Вряд ли это так.
Значит, просто формула делится на две половинки – одна для русскоязычных языковых предпочтений, другая – для западных. Интересно, откуда данные будут брать – это же нативных людей с запада брать нужно.
Ну, очевидно, что асессорских данных меньше и в формуле с англопредпочтениями будет адский адъ.
ЗЫ Кстати, странная должность Расковалова – что это еще за "отдел разработки качества поиска"? разрабатывают качество?

Интернет, 17 августа 2011 года. Яндекс запустил новую поисковую платформу — «Рейкьявик». Она учитывает языковые предпочтения пользователя. Теперь люди, которые чаще ищут англоязычные ресурсы, будут видеть в результатах поиска больше ссылок на них, и наоборот. Это первый шаг Яндекса в направлении персонализации поиска.

«По статистике Яндекса, большинство пользователей предпочитают ответы на родном языке. Но есть и те, кто ищет именно англоязычные ответы, — говорит Денис Расковалов, руководитель отдела разработки качества поиска. — Мы много экспериментировали, пытаясь найти наилучший способ удовлетворить потребности и тех, и других. В результате мы решили научить поиск учитывать языковые предпочтения пользователей и подстраиваться под них».

«Рейкьявик» обращает внимание только на запросы на английском языке. Он отфильтровывает латинскую транслитерацию русскоязычных запросов, адреса сайтов, ошибки раскладки клавиатуры и т.д. При этом сам англоязычный вопрос не всегда означает поиск такого же ответа, например, по запросам [beatles”> или [rothko”> человек может искать и русские сайты. «Рейкьявик» учитывает, часто ли пользователь открывает из результатов поиска веб-страницы на английском.

Информация о том, нужны ли пользователю англоязычные ресурсы, используется при ранжировании. И если нужны, человек видит среди первых результатов поиска больше ссылок на них. По данным «Рейкьявика», ответы на английском языке предпочитают около 8% пользователей Яндекса.

яндекс-выдача по несколько разультатов с сайта

как у гугла.
пример:

#1 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru Москва копия

#2 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru›Htms/About_Weleda.htm Санкт-Петербург копия

#3 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru›Htms/Medicine.htm Санкт-Петербург копия

Все результаты с сайта weleda.ru

via komdir
+ пример по irr.ru

ждем засилья клонов в яндекс-выдаче?

на роеме пишут по мотивам форума яндекса о том, что возможно разрешение клонированных объявлений в яндекс.директе:

RE: Когда прекратится обман в директе!??? Евгений Ломизе 23.06.2011 15:49
Павел, Вы услышаны. Это решение – о разрешении клонов – сейчас как раз рассматривается. Потому что мы действительно потеряли способность эффективно обеспечивать контроль в этом месте. Либо мы найдем достаточно надежный способ склеивать клоны на автомате, либо откажемся от этого ограничения.

-это в ответ на исходное сообщение про "когда прекратится обман в директе".
Кардинальное решение будет: раз не можем победить, то разрешим официально. 🙂
***
Раньше вроде эта тема работала для разаффилирования сайтов. Разные контакты и юрлица, но сайты аффилированы? Пытаешься дать рекламу в Директ и когда отказывают, начинаешь качать права – они разаффилируют сайты.
***
А теперь вот это останется в прошлом. Алгоритмы аффилирования – то автоматические.
Надо бы про них порыться в базе аффилиатов. Набрать побольше пар аффилиатов, перепроверить актуальность, собрать разных параметров сайтов, ???, PROFIT!

тема проверки ссылок

кажется, с темой проверки ссылок на вшивость будет проще взять больше сайтов, чем придумывать, почему отказывать. Хотя подозрительным личностям… я вот парочку подозрительных уже заподозрил в яндексоидности.

так пока что около 30 человек стукнулось.
и надо думать блин, светить или не светить сайты.

аффилиаты-3: яндекс убивается об стену

ЫЫЫ!!!

Предыстория. Сначала Яндекс в целях борьбы с определением аффилиатов сделал разгруппировку при использовании более одного оператора domain и rhost, потом я предложил использовать схему domain1.ru | domain2.ru для определения аффилиатов, рассчитывая. что уж такой простой оператор (ИЛИ) Яндекс не изнасилует. 🙂

Люди прикалывались, что яндекс закроет ИЛИ 🙂

И ТАКИ ОН ЕГО ПОЧТИ ЗАКРЫЛ!!!111. Или теперь работает через жопу.

Пример по отдельности:
1pointhall.ru – 1 место
1pointmsc.com – 1 место

А вот что нынче показывается по запросу 1pointmsc.com | 1pointhall.ru :

1 .com — Википедия ru.wikipedia.org›Com
2 Одноклассники.ru www.odnoklassniki.ru
3 RU-CENTER – регистрация доменов, домен РФ, хостинг сайтов, аукцион… www.nic.ru
4 @MAIL.RU:… новости, работа, рассылки, развлечения. Почта @MAIL.RU… www.mail.ru
5 СМИ.ru www.smi.ru

-и тому подобная муть.

Раскорячил он таки ИЛИ 🙂

Яндекс, я точно говорю – лучше сразу поиск отменить, больше нервов сэкономите. 🙂

кнопка “правильных апдейтов” под Яндекс-бар

Если у вас есть Яндекс-бар, то под него можно разрабатывать свои кнопки. Есть описание апи и клуб Яндекс.Бар, разработка компонентов.

Я сделал кнопку "правильных апдейтов" под Яндекс-бар. Нажмите на ссылку
УСТАНОВИТЬ кнопку правильных апдейтов.

В кнопке показывается:
* текстовые апдейты, рунета и буржунета – выкладывание проиндексированных текстов
* ссылочные апдейты
* апдейты сохраненной копии (komdir)
* апдейты тИЦ
* "релизы" (подкрутки выдачи без выкладывания текстового индекса)
* …еще буду всякого добавлять

Появится такое окно, в нем надо согласиться:

В результате кнопка будет выглядеть в панели примерно так: (на сегодня):

Если раскрыть менюшку, то там будет полная инфа по отдельным апдейтам:

При наведении мыши в альте показывается список апов:

Каждому апу соответсвует кнопочка, которые могут переводить на более детальную информацию.
Обновление кнопки: ночью раз в 30-60 секунд, позже раз в 5-10 минут.
Создайте тему на Сёрче первыми 🙂 УСТАНОВИТЬ кнопку правильных апдейтов!!!111.
Кроме того, кнопка расширяемая – я буду туда новые возможности добавлять!

ЗЫ
если вдруг какие неполадки – пишите мне на [email protected] – но теоретически их не должно быть – это ж платформа яндекс-бара, должно работать. но вот только что в МСИЕ7 у меня не захотело показывать кнопку ((