кажется, сеоньюз читать не умеет.

блин, я нигде не "предполагал, что данные операторы могут быть упразднены".

речь шла только про url, а если они криво задали вопрос (типа: спросили у пресс-службы про все операторы скопом), то и ответ неправильный будет.

кроме того, такие вопросы впрямую им вообще не имеет смысла задавать. впервые о сео услышали, что ли?

интересно, как сеоньюз это у себя откомментирует.

пара цифр с точкой – в Яндексе теперь отдельный терм

И да, забыл об одной штуке рассказать.

Я привык раньше все "левые" символы заменять в запросах пробелами. Чтобы не париться. Все равно типа при индексации эти знаки роли не играют, только могут разбивать предложение.

А тут упс: оказалось, что иногда с пробелом не находится то, что в документе с точечкой. И наоборот.

Присмотревшись, обнаружил, что в XML выделяются тегом подсветки hlword иногда не отдельные цифры, а пары X.X. И в выдаче так же – болдом выделяются пары.

например, ищем какой-нибудь 127.0.0.1 – и видим две выделенные пары: [127.0″> и [0.1″>.
У меня из-за этого как-то некошерно работал поиск с датами, с точечкой между цифрами, а ж ее по умолчанию пробелом пишу.

Захотелось проверить, динамически выделяются разные пары (чисто для показа) или нет. Оказалось, нет: на уровне индексации.
Примеры:
"10 10" << url:www.a-a-a.ru/nasos/gnom10.html – находится
"10.10" << url:www.a-a-a.ru/nasos/gnom10.html – нет (точки в документе нет)

в тройке 10.10.2010 выделяются [10.10″> и [2010″>

"10.10 2010" << url:www.kleo.ru/consult/fengshui/questions_4242.shtml – есть – пробел, где идет естественное разбиение
"10 10.2010" << url:www.kleo.ru/consult/fengshui/questions_4242.shtml – нет – пробел, где идет пара цифр.

1.2.3.4.5.6.7.8 – разбиение на пары [1.2″>, [3.4″>, [5.6″>, [7.8″>

Итог: получается, что на этапе индексации пары цифр с точкой объединяются и идут как целые термы в поиске (одна штука).
И так же действует в запросе – тоже пара цифр с точкой ищется как отдельный терм.

Вроде как понятно: хотели искать даты лучше и прочее. Только почему тогда не тройки цифр, а пары? И почему не тире, а только точка? И почему айпишники не по 4 цифры, а по две? И вообще, не помогает это имхо.

А, вот, практические выводы. Если вы продвигаетесь по запросу 127.0.0.1, ставьте ссылки с точными словами 127.0 и 0.1 🙂

XML: новейшие поломки и отключения операторов

Сегодня, кстати, был ссылочный апдейт, который апометр не увидел из-за того, что Яндекс коварно сломал оператор url и вместе с ним host, rhost в XML.

т.е., из выдачи они работают, а из ХМЛ – нет, выдают только обвязку (типа найдено столько-то результатов), а самих результатов не выдают.
Что смешно – в основном ХМЛ используют для поиска внутри сайта, и в примерах приведен оператор host, а тут бац – и он не работает 🙂

Блядь, то понос, то золотуха. Не трогайте свой ХМЛ!

А теперь инсайд 🙂
Я в ХМЛ позвонил, спросить чо ваще, может отключили сознательно. Мне сказали, что нет, сломалось, но сказали, возможно, что скоро оператор url будет закрыт в XML. Человек даже как бе не хотел его поэтому смотреть.

Так что готовьтесь парсить выдачу. Я, правда, не уверен, что именно он сказал – оператор будет закрыт ваще или закрыт только из ХМЛ. Так что и в выдаче могут закрыть.

турецкие асессоры

вакансии асессоров в Яндексе: http://spb.hh.ru/vacancy/2515886

знание английского, казахского (или татарского) языка (владение турецким языком является плюсом);

-чо, казахское и татарское ранжирования надвигаются? И турецкое еще.
белорусское сделали, вот теперь казахское будут ))
Матрикснет, как там: способен узкие темы обрабатывать.

мне, кстати, кто-то на конференциях жаловался про татарский интернет, что-то там с морфологией какие-то сложняки были.

эпический фейл

у меня пробивка изменения выдачи начинается с 4 утра до 8-9 собирает данные. Как правило, все апдейты к этому времени заканчиваются.

Но из-за того, что вчера ссылочный апдейт был поздно, в 5-50, выдача менялась в процессе, и часть выдачи скачалась измененная, а часть – нет.

Поэтому на след. день, сегодня, изменения доизменились, и типа было увидено изменение выдачи без выкладывания индекса, которого на самом деле не было. Почистил там всё.

про субботу

http://veterror.ya.ru/replies.xml?item_no=23592

В ближайшую субботу состоится то, чего вы все так долго (целый месяц!) ждали – традиционный ярушник в Серебряном Бору.

Мероприятие приурочено к Чешскому пивному фестивалю, в качестве спонсора выступает пиво “Пражечка”, пятью ящиками коего нас обеспечат. Ура! Мы постараемся придать встрече соответствующий антураж.

Картинка для привлечения внимания:

иерархическое дерево регионов Яндекса

Люди добрые, есть ли у кого-нибудь дерево вложенных регионов Яндекса? Так-то урывки этих иерархий и у меня есть, но маловато, хочется полное дерево.

вот полный список регионов где-то и сам яндекс дает, там около 2 тыс. записей вроде, только они без вложенности.

Подозреваю, что можно отпарсить tune.yandex.ru, чтобы получить дерево 🙂 Или там только поиском?

сегодня, кстати, мощный ап

по степени изменения взвешенной (с учетом позиций сайтов) – сегодня очень мощный ап яндекса, в разы мощнее, чем за весь месяц.

доля морд в выдаче очень сильно упала. На серче все говорят про выпадения морд, но неизвестно проверяли ли они – выпал ли урл или просто сменился.

туда же упала доля "из ЯК" и "еще с сайта". Наверное, все-таки что-то неслучайное, сложнее простых выпадений морд.

___________
УПД. Люди отвечают, что в основном смена релевантного урла с морды на внутряк. Ну чо, подкрутили алгоритм, совместили с текстовым апом )

УПД2 Пресслужба прокомментировала, что "ночью произошел технический сбой"

saved-copy-url специально для сеошников?

а вот интересно, я правильно понимаю, что тег saved-copy-url для урла сохраненки в Яндекс-ХМЛ сделан специально для сеошников? Чтобы они туда сразу ходили за проверкой своих ссылок в сохраненке?

Ведь для разработчиков поиска он не особо нужен – урл же чужой, на Яндексе, туда же не будешь пересылать юзера.

И вообще, поворачиваются потихоньку лицом. Вот, обсуждают – объясняют про коммерческую выдачу, типа поймите нас и все такое.

яндекс: UTF в сниппете и индексация отдельных букв?

Давно ли такое есть:

1. непередаваемые закорюки в сниппете – наверное, UTF8? Давно ли? Я помню, что Яндекс пропускал жирные точки и квадратики, но даже звездочек, как у гугла, не видел.

2. яндекс начал индексировать отдельные буквы из слов? Это не только подсветка, порядок выдачи меняется при перестанвках букв.