Матрикснет – pointwise, СПЕКТР – (list,pair)wise подходы?

Неожиданно получил возражения: что типа Спектр может основываться и на pfound-е.

Хрен с ними, с изменениями формул и возможностями, что что-то случайно размечено одинаково. Нет, Спектр должен быть основан на принципиально другом подходе к оценке качества выдачи. Судя по релизам.

Я слушал много разных записей про Матрикснет, и из них, и из услышанного на search-conf мне помнится следующее.

Есть типа три подхода к оценке качества выдачи – pointwise, pairwise и listwise.
pointwise, точечный – это когда каждый результат в выдаче просто имеет свою релевантность относительно запроса и она как-то взвешенно суммируется, и сумма = качество выдачи.
pairwise – это когда релевантность приписана упорядоченной паре результатов, дальше взвешиваем по всем парам.
listwise – это когда весь набор результатов в выдаче оценивается совокупно – хороший набор или плохой?

Мне помнится (общее впечатление), что яндексоиды вообще и Андрей Гулин в частности говорили, что мол, у них в Матрикснете листвайз подход.

Я и тогда в это не верил и не верю сейчас, по простым причинам –
1. Исходные данные – пойнтвайз. Оценки асессоров, на которых идет обучение – точечные и никак не завязаны ни на пары, ни на весь список.
2. Формула расчета релевантности щетает релевантность для отдельного документа = тоже пойтвайз.
Итого – матрикснет – пойнтвайз подход.

А со СПЕКТРом должно быть несколько другое. Если он должен учитывать разнообразие выдачи, то суммой по точкам оценивать ее качество нельзя. Это должен быть либо пресловутый листвайз, либо по парам. Типа для начала, для попробовать.

Другое дело, что если исходные данные – пойнтвайз, то ничего не получится. А систему оценок асессоров, насколько я понимаю, так просто не изменишь, раз, и оценки надо накапливать приличное время (ну хоть полгода) – два.

Но общая идея такова, что спектр должен быть или листвайз, или, на худой конец, пэйрвайз (кстати, результаты с разными поисковыми потребностями иногда чередуются, что наводит на мысль о пэйрвайз).

Не знаю уж, что за метрики и что за формулы используются, но качество выдачи тут должно зависеть не только от отдельных результатов, но от набора результатов.

Что, конечно, не вписывается в озвученную раньше метрику качества выдачи – pfound, хоть как ее не меняй.

ЗЫ с другой стороны, т.к. исходных данных, кроме пойнтвайз, нету – значит, используются какие-то костыли в виде поиска набора слов по сайту и использования этого при переранжировании.

яндекс-спектр: наблюдения

официальный http://company.yandex.ru/news/press_releases/2010/1215/index.xml
в блоге http://clubs.ya.ru/company/replies.xml?item_no=32028

Общие мысли:
1. в метрике pfound не заложено никакого “разнообразия” для оценки качества выдачи. т.е. то, что она разнообразная, эту метрику не повысит.
Следовательно, есть другая метрика, по которой меряется качество. Логично, что в яндексе есть несколько групп людей, каждая из которых продвигает в мозг начальства свою метрику. Для того, чтобы выглядеть длиннее, нужно выбрать удобных попугаев.
Видимо, происходит отказ от метрики pfound, пока что в виде навешивания сверху рюшечек (разнообразия).

Частные:
1. по набору однословников (а там каждый достоин своего спектра) навскидку около 20-30% “оспектрены”, остальная масса – нет. Т.е., еще грядут большие перемены.
2. отдельные потребности в спектре не пересекаются, но иногда явно разные потребности слеплены в одну. Например, в ноутбуках продажа и б.у. – не пересекаются, а в автомобилях – все свалено в одну кучу (б.у., продажа, отзывы, фото, характеристики, т.д.) Обидно оптимизировать – их разделят ведь потом, а выдачу надо сейчас 🙂
3. есть несколько разных видов расширения запроса – олдовые переформулировки, которые можно вычислить исключением слов, и спектровые, которые исчезают при малом изменении запроса.
4. спектр подсвечивает только в топ10 и нумдоком не обманывается. Подсвечивает в топ10, но работает и глубже.
5. надыбал десяток оспектренных запросов, по которым мониторю выдачу – потом посмотрю, не спектр ли начал выкатываться 20-го ноября. Наверное, он, вряд ли тут две сущности ))
6. есть ли спрос на пробивку и поставку в народ разбиения спектровых тематик? 🙂
7. встречаются явно дурацкие спекторвые слова – типа: “википедия”, “что такое”. Да, явно берется не из текстов, а из запросов.

чорт, демотиватор

имхо, после отдельной рубрики "демотиваторы" в картинках надо начинать на яндексе немножко ставить крест.

да, мы знаем – распыление примерно к такому и приводит.
и еще надо туда, в меню добавить – искать фотки котов!!! это гораздо популярнее же.

аффилиаты-3: яндекс убивается об стену

ЫЫЫ!!!

Предыстория. Сначала Яндекс в целях борьбы с определением аффилиатов сделал разгруппировку при использовании более одного оператора domain и rhost, потом я предложил использовать схему domain1.ru | domain2.ru для определения аффилиатов, рассчитывая. что уж такой простой оператор (ИЛИ) Яндекс не изнасилует. 🙂

Люди прикалывались, что яндекс закроет ИЛИ 🙂

И ТАКИ ОН ЕГО ПОЧТИ ЗАКРЫЛ!!!111. Или теперь работает через жопу.

Пример по отдельности:
1pointhall.ru – 1 место
1pointmsc.com – 1 место

А вот что нынче показывается по запросу 1pointmsc.com | 1pointhall.ru :

1 .com — Википедия ru.wikipedia.org›Com
2 Одноклассники.ru www.odnoklassniki.ru
3 RU-CENTER – регистрация доменов, домен РФ, хостинг сайтов, аукцион… www.nic.ru
4 @MAIL.RU:… новости, работа, рассылки, развлечения. Почта @MAIL.RU… www.mail.ru
5 СМИ.ru www.smi.ru

-и тому подобная муть.

Раскорячил он таки ИЛИ 🙂

Яндекс, я точно говорю – лучше сразу поиск отменить, больше нервов сэкономите. 🙂

кнопка “правильных апдейтов” под Яндекс-бар

Если у вас есть Яндекс-бар, то под него можно разрабатывать свои кнопки. Есть описание апи и клуб Яндекс.Бар, разработка компонентов.

Я сделал кнопку "правильных апдейтов" под Яндекс-бар. Нажмите на ссылку
УСТАНОВИТЬ кнопку правильных апдейтов.

В кнопке показывается:
* текстовые апдейты, рунета и буржунета – выкладывание проиндексированных текстов
* ссылочные апдейты
* апдейты сохраненной копии (komdir)
* апдейты тИЦ
* "релизы" (подкрутки выдачи без выкладывания текстового индекса)
* …еще буду всякого добавлять

Появится такое окно, в нем надо согласиться:

В результате кнопка будет выглядеть в панели примерно так: (на сегодня):

Если раскрыть менюшку, то там будет полная инфа по отдельным апдейтам:

При наведении мыши в альте показывается список апов:

Каждому апу соответсвует кнопочка, которые могут переводить на более детальную информацию.
Обновление кнопки: ночью раз в 30-60 секунд, позже раз в 5-10 минут.
Создайте тему на Сёрче первыми 🙂 УСТАНОВИТЬ кнопку правильных апдейтов!!!111.
Кроме того, кнопка расширяемая – я буду туда новые возможности добавлять!

ЗЫ
если вдруг какие неполадки – пишите мне на [email protected] – но теоретически их не должно быть – это ж платформа яндекс-бара, должно работать. но вот только что в МСИЕ7 у меня не захотело показывать кнопку ((

сегодняшний “релиз” = это апдейт переформулировок

сегодня и у Ашманова, и у меня отметило изменение выдачи без текстового апа.

Щито бы это могло быть?

У меня есть CRM, в ней вдруг нарисовались изменения выдаваемых тайтлов по разным запросам. Но сами выдаваемые тексты (буквы) остались прежними – изменились коды, подсветка слов изменилась.

Те слова, что раньше не подсвечивались – стали подсвечиваться. Если у кого кешируется пробивка позиций – проверьте. И позиции подросли по тем тайтлам, где стали подсвечиваться доп. слова.

Например, слова "раскрутка" раньше не было в переформулировках и не подсвечивалось по запросу "продвижение сайта", а теперь вдруг стало:

1 Создание и раскрутка сайта в интернете, поисковое продвижение
www.MegaSeo.ru

2 Раскрутка сайта в Яндексе, Google и продвижение сайта в ТОП (Москва…
www.bdbd.ru

И слово "раскрутка" стало подсвечиаться.
Надо ли говорить, что те, кто традиционно стоял высоко по "раскрутке", вдруг стал фтоп и по "продвижению".

***
Надо ли еще дополнительно говорить, что переформулировки влияют и имеют приличный вес 🙂
***
Надо бы в апометр воткнуть.

Яндекс-капча русская будет? ))

ааааа!!!!1111

Регал акк в яндекс-почте и обалдел – показывало в капче вместо цифр русские буквы и прямо так и было написано рядом – типа, введите русские буквы с картинки.

А хорошая борьба с антикапчей )) Индусы-то с китайцами русских букаф не понимают.
Ну чо, поддерживают отечественного производителя… Русских индусов нужно будет нанимать.

Но это взрыв мозга, я не ожидал русские буквы увидеть )) Воспроизвести не удалось.

расширение сниппетов Яндекса для организаций

Долгое время подобная дополнительная информация показывалась в сниппетах только для сайтов гостиниц. Сегодня к ним добавились следующие типы организаций: рестораны, пиццерии, кафе и кофейни, бары и пабы, спорт-бары, кинотеатры, музеи, аэропорты, фитнес-клубы и автошколы.