в тему “апа поведенческого” 1-го числа

в тему про якобы ап поведенческого раз и два

🙂
***
1. есть сайты, которые перестали крутить ПФ после 21-го, и НЕ вернулись 1-го
2. есть сайты, которые продолжали крутить ПФ после 21-го и ВЫРОСЛИ 1-го (методы кручения одинаковые)
3. всем известные мегасео не вернулись (это к вопросу о различии санкций и изменения параметров ранжирования)

мое мнение (пока что):
1. был мощный пересчет стат-факторов (сами статфакторы изменились 31-го, а 1-го они учлись во влиянии на ссылочное). Это в том числе может быть траст, ВИЦ и жыр ссылок, который от него зависит.
2. были сильные изменения формулы. начал сильно выпирать быстроробот. начал выпирать ЯК и тИЦ. усохло влияние морд. (это по куску формулы, которая не зависит от запроса)

Ну понятное дело, что под мощное обновление нужно обновить всё сразу, семь бед-один ответ, заодно можно и ПФ с начала начать считать. Но это как бы малая часть.

Я пока не облазил все свои владенья на предмет этого апдейта.
и смотрите сами:

1. http://tools.promosite.ru/monitoring/inner2all.php?curdate=2011-06-03&q_numwords=&q_type=%EC%ED%EE%E3%EE+%F0%E5%E7%F3%EB%FC%F2%E0%F2%EE%E2&q_textual=domain&q_changetype=%E8%F1%F5. выдача по операторам вида domain: (в древние времена там самый траст вылезал, потом подкрутили, но там все равно не зависящие от запроса факторы определяют)
по ним:
доля МОРД в выдаче была около 50% и упала в ноль
доля быстроробота выросла с нулей до 100% (и вообще с БР траблы щас)
(это можно самостоятельно наблюдать)
доля ЯК, средний тиц, число страниц выросли
сильный переколбас с регионами, доля москвы упала, “другие регионы” выросли

короче, я голосую за пересчет вица и жыра ссылок и за подкрутку формулы (явно видно по быстророботу и мордам).

релевантность “all” – зло (2)

яндекс: 32sl738r прошивка видео

В серпе Яндекса слово "прошивка" отсутствует наглухо – сплошь магазины и предложения купить сам телек…

все десять результатов – relevance priority="all", понятное дело.
что-то матрикснеты фигово обучают.

мои ВЛ в Мейнлинке

По данным Мейнлинка я смог пробить много доноров на “свое” качество, выбрал 5К, и они его прикрутили как один из вайтлистов: http://forum.searchengines.ru/showthread.php?t=632411

Судя по интерфейсу, собираются делать больше одного вайтлиста. Типа там сейчас только от меня, но явно под расширение сделано.

Сапа, я теперь хочу ваши ссылки )) Самому качать лениво.

перманентный быстроробот

товарищи яндексоиды!
Я вот не понимаю. Быстрорбот – он же для свежих документов или как? И базы у основного и быстрого робота разные.
Т.е. появился документ – проиндексирован БР – появился в выдаче на пару дней из базы БР – пропал – появился в выдаче через один ап в основной базе.

А вот как же так получается, что с самого начала времен документ http://WebStudio2U.net/ru/web-promotion/194-promotion-recomendation.html находится безвылазно в быстророботе (и по совместительству – в топ10 по “продвижение сайтов” 🙂 )

Почему он из БР не вылетает? Или это для региона “Сумы” так редко появляются новые документы и оттого так долго живет быстроробот?

избавился от англоапдейтов

в сервисе апдейтов уничтожил отдельную пробивку русскоязычного (lang:ru | lang:uk) и буржуйского (lang:en | lang:de | lang:fr) индексов.

И с начала этого года подтер показ отдельных.

Это раньше англоязычная и русская база были отдельно (физически, как сейчас отдельно от основного индекса живут базы быстрых роботов), а сейчас рунет и буржунет вместе, слиты в одну базу. Когда это произошло, я не следил, но, видимо, в конце 2010. Тогда время между RU и EN апами стало малым и разница была чисто за счет случайности.

Были бы архивы ХМЛ, можно было бы посмотреть.

прюнинг в яндексе?

кажется, в яндексе что-то жуткое произошло с прюнингом: http://tools.promosite.ru/updates/details.php?data=2011-04-12
в районе 16-17 дня.

число показываемых документов-сайтов подросло в 10-100 раз.
поскольку это произошло по старым датам, о новом индексе не идет речь, а либо изменение в показываемом числе страниц, либо в новой базе (я верю только в отключение прюнинга)

и все лимиты, понятное дело, съехали, надо новые придумывать.
сейчас снова апдейт кажет от съехавших лимитов…

завтра.

ссылочные апдейты быстрые стали

ссылочные апдейты раньше происходили через 2-3-4 часа после текстовых, а в последние два апа стали происходить через полчаса – 10 минут после текстовых.

ну чо, зато выдача должна в окончательном варианте быть видна сразу.

продажа релевантности Яндексом – давно пора

лента.ру пишет, что Яндекс запустил георекламу … Теперь компании могут заказывать у поисковика приоритетное размещение адресных ссылок на Яндекс.Картах.

По стоимости для Москвы – от 10 рублей в день.

Что дает приоритетное размещение:

1. Показы на более выгодных позициях в списке организаций на Яндекс.Картах — в ответ на запросы, соответствующие рубрике организации, — и особая заметная метка на карте
2. Возможность добавления рекламного текста
3. В результатах поиска Яндекса выделенная организация показывается на первом месте в модуле с картой — над результатами поиска.

Это очевидным образом продажа релевантности:
1. Гео-положение юзера учитывается в релевантности, очевидно: чем ближе, тем релевантнее.
2. Если одни вылезают вперед (да-да, именно выше других, как и описано) = вылезают за счет других, более релевантных результатов.

Итог – релевантность списка меньше, бабла больше.

***
Ящетаю, давно пора продавать релевантность и в обычной выдаче. А то ссылки какие-то ставить, говносайты делать…

Например, докупить релевантность в дополнение к имеющейся по какой-нибудь прогрессивной шкале типа:
1 единица релевантности – 1 рубль
2 единицы – 4 рубля
4 — 16
и т.д. Чтобы совсем нерелевантным сайтам было дорого продвигаться.
А сеошники тоже в этой схеме не умрут – они будут оптимизировать сайты так, чтобы естественная релевантность была повыше и докупка была бы дешевле. 🙂
и рефпрограмму.
PS и мне законный прОцент, конечно ))
PPS а коэффициенты в этой прогрессивной шкале матрикснетом оптимизировать. чтобы бабла было больше.

Матрикснет – pointwise, СПЕКТР – (list,pair)wise подходы?

Неожиданно получил возражения: что типа Спектр может основываться и на pfound-е.

Хрен с ними, с изменениями формул и возможностями, что что-то случайно размечено одинаково. Нет, Спектр должен быть основан на принципиально другом подходе к оценке качества выдачи. Судя по релизам.

Я слушал много разных записей про Матрикснет, и из них, и из услышанного на search-conf мне помнится следующее.

Есть типа три подхода к оценке качества выдачи – pointwise, pairwise и listwise.
pointwise, точечный – это когда каждый результат в выдаче просто имеет свою релевантность относительно запроса и она как-то взвешенно суммируется, и сумма = качество выдачи.
pairwise – это когда релевантность приписана упорядоченной паре результатов, дальше взвешиваем по всем парам.
listwise – это когда весь набор результатов в выдаче оценивается совокупно – хороший набор или плохой?

Мне помнится (общее впечатление), что яндексоиды вообще и Андрей Гулин в частности говорили, что мол, у них в Матрикснете листвайз подход.

Я и тогда в это не верил и не верю сейчас, по простым причинам –
1. Исходные данные – пойнтвайз. Оценки асессоров, на которых идет обучение – точечные и никак не завязаны ни на пары, ни на весь список.
2. Формула расчета релевантности щетает релевантность для отдельного документа = тоже пойтвайз.
Итого – матрикснет – пойнтвайз подход.

А со СПЕКТРом должно быть несколько другое. Если он должен учитывать разнообразие выдачи, то суммой по точкам оценивать ее качество нельзя. Это должен быть либо пресловутый листвайз, либо по парам. Типа для начала, для попробовать.

Другое дело, что если исходные данные – пойнтвайз, то ничего не получится. А систему оценок асессоров, насколько я понимаю, так просто не изменишь, раз, и оценки надо накапливать приличное время (ну хоть полгода) – два.

Но общая идея такова, что спектр должен быть или листвайз, или, на худой конец, пэйрвайз (кстати, результаты с разными поисковыми потребностями иногда чередуются, что наводит на мысль о пэйрвайз).

Не знаю уж, что за метрики и что за формулы используются, но качество выдачи тут должно зависеть не только от отдельных результатов, но от набора результатов.

Что, конечно, не вписывается в озвученную раньше метрику качества выдачи – pfound, хоть как ее не меняй.

ЗЫ с другой стороны, т.к. исходных данных, кроме пойнтвайз, нету – значит, используются какие-то костыли в виде поиска набора слов по сайту и использования этого при переранжировании.