Яндекс: 5 сентября релиз без апдейта?

Сегодня у меня мониторилка позиций задетектила изменение выдачи (на морде и в rss отметки пошли, они около 15 дня туда идут, а в списке апов почему-то не отображается, буду исправлять).
При этом выкладывания базы сегодня не было: http://tools.promosite.ru/updates/details.php?data=2009-09-05 и Ивановский апометр тоже молчит.

А вот Ашмановский апометр (на пробивке позиций) подтверждает апдейт 5 числа: http://analyzethis.ru/?analyzer=update&searcher=yandex , так что это не мои глюки.

Я вот к чему: особенно прикольно знать, когда просто новая база выложена, а когда алгоритм подкрутили.

Всех с релизом!!! 🙂

PS Типа день города отметили, тока щас вспомнил.

нашел вид запроса, который “валит” Яндекс

Вместо выдачи – полностью пустая страница открывается, нет даже надписи "ошибка и т.п.".

В XML по такому запросу – выдает невалидный код для броузера, но если сохранить и посмотреть сорцы хмля, видно, что кусок запроса отрезается и происходят непредсказуемые переключения параметров группировки (с deep на flat, например).

Теперь думаю, чо с этим запросом делать. Жаль, я не кулхацкер, а то интересного наковырять можно было бы 🙂

Есть у кого знакомые, кто может посоветовать, как дальше ковырять? 🙂

Я.ХМЛ – то понос, то золотуха

Только я успел написать про тег doc id="" в ХМЛе (кстати, у быстроробота уже не 23, а 25 и у зарубежки не 24, а 26) – как опять все переколбасило… Под эти все изменения ХМЛ еще вроде бы не работал некоторое время.

1. doc id стал больше похож на айди. Теперь он выглядит примерно так: doc id="13-28-17-13613987", первое 13 – это как и было, последнее число – параметр d (типа айди документа?), что за два числа в середине – непонятно (у быстроробота – одно число).

2. отменили сортировку по tm (время модификации) – уже на Сёрче кто-то ругался. В докуметации описано – так и верните взад!

3. окончательно похерилась геовыдача… В прошлый раз удалили теги geo и geoa, но тег categ attr="geo" оставался в четверти случаев… А теперь и его нету. Геоданным полный ППЦ, похоже…

Когда ж у них там устаканится…

Яндекс.XML: теперь doc id=”13-” – сменился

в Я.хмле есть параметр найденного результата <doc id="". Это реально никакой не айди сейчас, но когда-то им был. Потом для всех обычных документов он стал что-то типа 8- или 9- (и эта цифра потихоньку растет), и только для быстроробота был похож на айди, так можно было отличить быстроробот. Потом и у БР он стал фиксированным, но отличным от обычной базы.
Раньше было так:
обычный робот: doc id="12-"
быстроробот: doc id="22-"
зарубежная база: doc id="23-"
(сперва я забыл и засомневался: то ли 24-23, то ли 22 у БР и запада, но поднял архивы в тулзе регионов – так получилось)
А теперь стало так:
обычный робот: doc id="13-"
быстроробот: doc id="23-"
зарубежная база: doc id="24-"

По времени – это произошло на днях, 6 июля doc id="12-" стал меняться на 13, позже – от 7 июля двенадцати вообще нет. И заодно сменились БР и буржунет.
Я кагбе не знаю, что оно означает, но вроде апдейт только сегодня 8-го, а 6 и 7 никаких изменений не было – ни у меня в апометре, ни в апометрах выдачи.
Так что это вряд ли айди алгоритма и формулы, как думали другие люди.
Апдейта по выкладыванию индекса тоже не было – так что это вряд ли айди базы-хранилища индексов, как я думал раньше.

Может, это айди хранилища кешей или типа того? Кто мониторит – посмотрите, на какие айпи показывал раньше и стал показывать теперь хайлайтер яндекса hghltd.yandex.net?
Еще какие-нибудь идеи, что это за айди?

Яндекс удалил гео-теги geo и geoa из XML…

ггггг
доходит до них, как до жирафа, не очень быстро… 🙂
Меня тут просили в сервисе определения региона обновлять данные, а там накопилось 210 тыс. сайтов, из них 170 тыс – саподоноры, ну и мне лениво же все обновлять.
Я тогда сделал кнопочку для горячо любимых сайтов – если данные взяты не сегодня, то можно нажать на кнопочку "обновить" и они перезапросятся.
Сейчас понажимал – смотрю, конечные регионы по тегам geo и geoa пропадают. Проверил в ХМЛ – действительно, этих тегов нет, остаются только вложенные теги categ attr=geo, но они очень редко где есть.
Например – зайдите во Владикавказ, Универсальное, Россию, выберите сайтики снизу, у которых дата несегодняшняя и есть регионы по тегам geo и geoa, понажимайте обновить – они пропадут. И в исходном ХМЛе их, конечно, нет.
А хрен ли – недокументированная фича 🙂
Себе я базу-то скопировал, конечно… 🙂
Так что кому нужны выборки по регионам для сапы – регистрируйтесь и качайте геосписки – а то понажимают на обновление, все данные-то и пропадут. А я буду базой приторговывать. 🙂
Надо будет в яплатон регионы интегрировать.

PS
Посчитал –
тег geo был у 39507 доменов
тег geoa у 127925 (предположительно автоматическое определение)
тег categ attr=geo был у 39584 доменов

Так что если categ attr остался, то три четверти геобазы теперь недоступно…

“еще с сайта” без цифирок теперь?

url="www.yandex.ru/*"
Рядом со ссылкой "еще с сайта" цифирок нет.
Какой смысл, юзеру понравится не знать количество страниц, что ли…
И парсить объем сайта тяжелее, хотя в ХМЛ, вероятно, есть – там же отдельный тег под это выделен, пойду смотреть.

Хотя это может быть связано чисто с проблемами нагрузки. Типа, считать число релевантных запросу страниц внутри каждого сайта – мощностей не хватает?

seochase.com сдох…?

не помню уже точно… http://seochase.com/ – когда-то был форум Маузера, потом его, кажись, ашмановцам продали.
Что-то там писали и иногда бодро…
А сейчас, кажись, капут – спама уже полно: http://seochase.com/viagra-online-kaufen-ohne-rezept-viagra-auswirkung-t11643.html
Оппаньки.

Я-Платон.РУ – стань асессором

Я решил завести новый сервис – "Я-платон.ру", для оценки качества сайта-донора перед покупкой ссылок с него.
Прошу пройти, почитать исходник: http://www.ya-platon.ru/
Вкратце:
Человек (Вы) ходит, оценивает сайты-доноры, отмечает ГС, сателлиты, нормальные сайты, прочее. Если несколько человек оценили сайт одинаково, оценка принимается за окончательную. И потом за каждую оценку Вы имеете доступ к (например) 100 окончательным оценкам, которые можете внести в WL или BL. В зависимости от качеста доноров 🙂
Основные цели, зачем:
1. ГС вылетают из поиска, проще на них не покупать, чем пробивкой заниматься
2. ГС могут определяться с некоторой точностью (вычищают их автоматом), вдруг отрицательный вес у таких ссылок сделают
3. Траста не будет с ГС-доноров, и наоборот, с живых людских сайтов – будет более вероятно.
4. Карма 🙂
Точнее говоря, проект еще не запущен, я сделал голосовалку и тему на Сёрче. Нужно знать, сколько примерно сайтов человек готов проверять в день.
По результатам пятницы и выходных:
Сейчас: 252 регистраций. Проголосовало 166 человек, они запланировали в сумме 4329 оценок в день.
Я примерно прикидывал, что при 10 тыс. оценок в день сервис пробьет всю сапу за 3 месяца. Уже выясняется, что этот план на 40% уже выполнен, т.е. сервис почти гарантированно будет запущен.
Вот кусок результатов голосования – с кучей полезных советов:
http://www.ya-platon.ru/vote_r1.php
http://www.ya-platon.ru/vote_r2.php
http://www.ya-platon.ru/vote_r3.php
Люди, оказывается, не любят говносайты, и за их вычистку из покупок. Причем куча очень развернутых предложений.

Пойду читать результаты.

Регистрируйтесь, голосуйте, участвуйте. 🙂