сегодняшний апдейт

Вот сегодняшний апдейт, в который выложили документы за два дня, а изменение выдачи близко к нулю (2.6% по моим мерам) как бы говорит нам, что изменения в выдаче чиста от выкладывания новых документов – не бывают.

А бывают от пересчета параметров, а пересчета, значит, не было.

Кстати, внизу приводится взвешенное изменение выдачи по разным классам запросов, и самое приличное изменение выдачи по классу запросов "редкие никакие". 🙂
По таким запросам да, выкладывание документов – определяющий фактор. 🙂

Указание региона сайта в Яндекс.Вебмастере для тИЦ=0

на серче заметили раньше, чем яндекс объявил. 🙂

интересно, на сколько повысится число сайтов с регионом. Судя по требованию страницы с "подтверждением" отношения сайта к региону, таки модераторы это смотрят.

нужно пару советов по развитию апометра

апометр развивается: сейчас есть ссылочные и текстовые апдейты, комдир, мониторинг выдачи, мощность изменений по разным классам запросов.

но будет развиваться еще сильнее, а именно:

1. гео.
будут апдейты геопривязки сайтов. частенько при изменении выдачи без индекса оказывается, что прошел геоапдейт. Какие нужны данные – достаточно просто указать, что мол, геоапдейт (они бывают, как правило, в дни текстовых апдейтов, около 4-5 утра).
Методика – контроль числа сайтов и страниц в поиске по региону. Поэтому кроме чисто времени можно выдавать и количественные данные (* на сколько повысилось-понизилось число сайтов).
Оно вам нано? Да, и какие регионы тогда брать?

2. пересчет весов ссылок
бывает и в обычные текстовые апдейты для уже имеющихся старых ссылок. обычно около 4-6 утра.

3. апдейты факторов по общей базе рунета
типа весов слов. тоже бывает в дни текстовых апдейтов, тоже около 4 утра.
также можно довольно точно считать относительные изменения в общем размере базы – типа подросла ли она и насколько.
Обычные методы (типа запросов domain:root) изза прюнинга дают фиговую точность, а прюнинг врубается в полный рост при числе найденного около 20-30 тыс. доменов.

4. относительная мощность ссылочного и текстового по положению НПС
есть запросы, где много НПС. я тут открыл запрос, который позволяет выпячивать НПС )) Можно считать относительное положение НПС-результатов относительно текстовых. (конечно, ранжирование НПС совсем другое, но все равно). Нано?

пара цифр с точкой – в Яндексе теперь отдельный терм

И да, забыл об одной штуке рассказать.

Я привык раньше все "левые" символы заменять в запросах пробелами. Чтобы не париться. Все равно типа при индексации эти знаки роли не играют, только могут разбивать предложение.

А тут упс: оказалось, что иногда с пробелом не находится то, что в документе с точечкой. И наоборот.

Присмотревшись, обнаружил, что в XML выделяются тегом подсветки hlword иногда не отдельные цифры, а пары X.X. И в выдаче так же – болдом выделяются пары.

например, ищем какой-нибудь 127.0.0.1 – и видим две выделенные пары: [127.0″> и [0.1″>.
У меня из-за этого как-то некошерно работал поиск с датами, с точечкой между цифрами, а ж ее по умолчанию пробелом пишу.

Захотелось проверить, динамически выделяются разные пары (чисто для показа) или нет. Оказалось, нет: на уровне индексации.
Примеры:
"10 10" << url:www.a-a-a.ru/nasos/gnom10.html – находится
"10.10" << url:www.a-a-a.ru/nasos/gnom10.html – нет (точки в документе нет)

в тройке 10.10.2010 выделяются [10.10″> и [2010″>

"10.10 2010" << url:www.kleo.ru/consult/fengshui/questions_4242.shtml – есть – пробел, где идет естественное разбиение
"10 10.2010" << url:www.kleo.ru/consult/fengshui/questions_4242.shtml – нет – пробел, где идет пара цифр.

1.2.3.4.5.6.7.8 – разбиение на пары [1.2″>, [3.4″>, [5.6″>, [7.8″>

Итог: получается, что на этапе индексации пары цифр с точкой объединяются и идут как целые термы в поиске (одна штука).
И так же действует в запросе – тоже пара цифр с точкой ищется как отдельный терм.

Вроде как понятно: хотели искать даты лучше и прочее. Только почему тогда не тройки цифр, а пары? И почему не тире, а только точка? И почему айпишники не по 4 цифры, а по две? И вообще, не помогает это имхо.

А, вот, практические выводы. Если вы продвигаетесь по запросу 127.0.0.1, ставьте ссылки с точными словами 127.0 и 0.1 🙂

иерархическое дерево регионов Яндекса

Люди добрые, есть ли у кого-нибудь дерево вложенных регионов Яндекса? Так-то урывки этих иерархий и у меня есть, но маловато, хочется полное дерево.

вот полный список регионов где-то и сам яндекс дает, там около 2 тыс. записей вроде, только они без вложенности.

Подозреваю, что можно отпарсить tune.yandex.ru, чтобы получить дерево 🙂 Или там только поиском?

яндекс: UTF в сниппете и индексация отдельных букв?

Давно ли такое есть:

1. непередаваемые закорюки в сниппете – наверное, UTF8? Давно ли? Я помню, что Яндекс пропускал жирные точки и квадратики, но даже звездочек, как у гугла, не видел.

2. яндекс начал индексировать отдельные буквы из слов? Это не только подсветка, порядок выдачи меняется при перестанвках букв.

спасибо товарищу Яндексу

… за то, что вернули почти обратно уменьшенный до двадцатки лимит на ХМЛ, теперь лимит 100 на страницу.
Пойду возвращать обратно свои скрипты по 50. 🙂

ОбъЯвитесь, может, кому спасибо говорить? Есть предположение, что это тов. anatolix 🙂

И тогда вот еще – я жалуюсь на отключение оператора ИЛИ в тайтле в яндекс-новостях!

10 тыс оценок асессоров

по мотивам отчота про визит Яндекса в Беларусь, в частности:

• На yandex.by будет стоять специально модифицированный вариант поискового алгоритма;
• Для поиска на yandex.by было собрано порядка 10 000 оценок асессоров;

Непонятно:
1. в чем модифицированность, вроде как тот же Матрикснет выкатить проще?
2. Десять тысяч оценок асессоров! Маловато будет!!! 🙂 скажем, на ашмановском семинаре Гулин говорил про 2 млн. оценок за два года, Садовский на конфе раньше говорил про 1 млн. оценок по не-помню-скольки запросам, но получалось по 100 оцененных результатов на запрос.

Если так же считать, для Беларуси оценили 100 запросов 🙂
Может, для того и модифицирован алгоритм, чтобы меньше статистики жрал? Скажем, факторов меньше использовать?

Вот интересно. В 100-200 раз меньше оценок, а интересов у юзера примерно столько же. Ну, допустим, чисто белорусские геозависимые запросы оценивали. Но не в сто раз меньше! Это ж коммерческие запросы, типа окон.

Ладно, будем искать разное интересное на yandex.by для сравнения и искать отжиги. Я только не понял, уже вроде как yandex.by уже тот самый, особенный, или только собираются выкатить.

И вот – даже по геонезависимым запросам бу-выдача тоже отличается от рушной.

___
PS А тут свежее пишут с яндекс-студня – что 4 млн документов и 100 тыс запросов оценено.

ссылочные апдейты яндекса на tools.promosite.ru

как и обещал, на http://tools.promosite.ru сделал показ ссылочных апдейтов.
сегодняшний ап был ссылочный, вот как раз сегодня и вывешиваю. 🙂

методика – экспериментальные сайты, смотрим, когда ссылка начинает играть во вкладе в релевантность.

мониторю я эти апы недавно, на http://tools.promosite.ru/updates/ всего ссылочных апов:
31 марта 2010 учтены ссылки, попавшие в индекс по 19 марта 2010
13 марта 2010 учтены ссылки, попавшие в индекс по 7 марта 2010
26 февраля 2010 учтены ссылки, попавшие в индекс по 18 февраля 2010

В общем, примерно два апа в месяц. Раз в две-три недели.
Время апа только в последний раз удалось задетектить – между 4 и 4-20. (я раньше думал, что должны вместе с текстовым апом выкладывать, и в 3 утра прекращал пробивку :))

Так что вполне вероятно, что выкладывают ссылки отдельно.
И правильно, что сразу после текстового апа люди особо не видят изменений, нужно дождаться совсем утра.

в RSS http://tools.promosite.ru/rss.php
и в виджете http://www.yandex.ru/?add=10156
это уже сегодня утром показалось и импортнулось.

апометр tools.promosite.ru теперь с методом комдира

в апометре http://tools.promosite.ru/ раньше апы детектились раз в час,
потом я добавил отдельную пробивку русских и буржуйских апов,
потом добавил пробивку раз в минуту (ап буржуйского индекса почему-то наступал на 5-10 минут раньше).

А теперь – добавил метод Комдира.
несколько последних апов http://tools.promosite.ru/updates/ метод комдира детектит на 15 минут раньше. 🙂

юзайте.
RSS: http://tools.promosite.ru/rss.php
добавить ифрейм-виджет на морду яндекса: http://www.yandex.ru/?add=10156 и исходник виджета: http://tools.promosite.ru/widget.php

во все это внедрен метод комдира.

***
скоро еще добавится показ ссылочных апдейтов! 🙂