Яндексоиды: LSI – нет, но расширение запроса – да

Многие поделились ссылкой на доклад А. Сафронова (Яндекс), где он говорит на 28 минуте, что вся пачка методов LSI-pLSI-LDA не работает (что их сигнал полезен по сравнению с BM25, но имеющееся яндексовое качество не улучшает)

А вот ссылка на другую секунду, где он говорит, что запрос расширяется дополнительными словами (слова тупо добавляются в запрос – это кстати про методы учета синонимов важно) и матчат с документом по всей пачке слов

Смысловое соответствие текстов в ранжировании — Александр Сафронов

По виду это будет вполне похоже на “сеошный LSI” (типа – напихал “хороших” слов – стало лучше), но работать должен не только на ВЧ, но и на НЧ тоже (а когда в прошлый раз с LSI по Акварели я смотрел – не работало, Чекушин говорил в комменариях на ФБ, что для ВЧ только должно работать, так кто ж их на эксперимент даст!)

Но есть еще следствия, кроме рабочести на СЧ и НЧ –

  1. вся эта штука (в докладе расширение словами) – переранжирование, динамический расчет
  2. “порядок слов в запросе”  не так уж и важен на соответствие документов, на него фапать не надо (ну, с введением релевантности типа all это и так видно было)
  3. Разные стратегии продвижения однословников, двусловников итд – ересь

Кажется, LSI в Яндексе (от just-magic, Акварель) не особо работает

Исходник на FB в группе SEO без цензуры

Действия –
* зареган домен ceramic-tile-for-bathroom.ru
* под запрос “керамическая плитка для ванной комнаты” из Акварели взят список рекомендуемых слов и фраз
* к рекомендованным словам и фразам из топа придуманы заменители и пробиты через Акварель так, чтобы эти замены были хуже основного варианта по рекомендации системы (zip, в нем xls, лист раскраска акварелью)
* на основе этих слов и фраз было сгенерено около 180 документов, в которых каждая из 38 фраз заменялась на плохую (плохие), около 5 раз для одинакового числа замен
* в php файле последовательность массивов, в каждом из них первый элемент – самый лучший рекомендованный, остальные хуже (если больше 1 элемента)
* все сгенерено в сайтик, 2 уровня структуры, 3 уровень – сами тексты, сайтмеп в роботсе, ЯВМ. Страницы последнего уровня имеют имена text-(число замен)-(список индексов массивов замен, где больше 1 элемента).html
* выкачана выдача по запросу керамическая плитка для ванной комнаты с ограничением внутри сайта

* на рисунке нарисовано число замен от позиции в выдаче

Если бы LSI от just-magic работало, в начале выдачи находились бы документы с малым числом замен хороших слов на плохие.

А в реальности – полная мешанина позиций:


Это при том, что слова на замену более “весомые” и могли бы давать фору “хорошим” вариантам

В файле 3 даты снятия позиций – 6, 15, 20 апреля

Точное вхождение запроса есть.

Вот какая была раскраска акварелью

 

Читать далее «Кажется, LSI в Яндексе (от just-magic, Акварель) не особо работает»

ссылочные апдейты сейчас странные

есть маза, что отдельно ссылочное обновляется для ссылок между доменами и отдельно внутрисайтовое.

внутрисайтовое обновилось, НПС от 18 числа, как и должно быть.

а межсайтовые НПС от 11 числа, хотя тексты анкоров переиндексированы.

наверное, нужно вводить определение двух типов апдейтов…

Викимарт-математика 2013

Йо, Викимарт молодцы
http://olymp.wikimart.ru/

Задача 1
Прогнозирование вероятности того, что пользователь сделает заказ через колл-центр

Задача 2
Прогнозирование вероятности отказа пользователя от созданного заказа

Задача 3
Прогнозирование вероятности ухода посетителя с сайта

Главное, чтоб задачи были не в формате “а теперь скажите, господа, в каком году умерла у швейцара бабушка”.
Пока есть сомнения.

умер Илья Сегалович, 1964–2013

http://clubs.ya.ru/company/69367

Аркадий Волож

Мы дружили с Илюшей со школы, четыре года сидели за одной партой. А потом вместе делали Яндекс. Сегодня ночью его не стало. Все случилось слишком быстро и неожиданно.

Последний раз он выступал перед нашими cтамбульскими ребятами в прошлый четверг. Он вышел и сказал: «Здравствуйте, меня зовут Илья». Все засмеялись, и он рассказал про поисковую платформу Острова.

Не знаю, чем можно заменить его энциклопедичность в технологиях и чистое видение продукта. Но он оставил за собой целое новое поколение программистов, целую школу. А его этические стандарты задали уровень всем нам.

Краудлимитинг ЯндексХМЛинга

Краудлимитинг ЯндексХМЛинга

***
Яндекс тут на месяц раньше против предыдущего срока решил ввести лимиты на Яндекс-ХМЛ
http://webmaster.ya.ru/replies.xml?item_no=15783
Они не будут зависеть от айпишников и то симок, а только от наличия живых сайтов, каждый их которых будет получать ежедневный лимит ХМЛ по сетке
0 – 34 – 150 – 490 – 1000 – (говорят, есть больше)
запросов в день

Если у кого есть лимиты – сайты и в них нет особой необходимости – прошу пожертвовать их лимиты для сервиса tools.promosite

* Это я прямо сейчас так спрашиваю, безвозмездно – потом внедрю всякие хорошие плюшки для тех, кто пожертововал.

Как это сделать –
1. Добавить сайт в webmaster.yandex.ru
2. Зайти в xml.yandex.ru, “начать работу”, поставить галочку “согласен с условиями” внизу страницы
3. В разделе “Информация о лимитах” http://xml.yandex.ru/limit_info.xml будет список ваших сайтов с возможностью передеть лимит
4. Пожертвуйте лимит на логин yatools на Яндексе. Тогда он торжественно появится в сервисе и я смогу желать общественно полезные запросы и давать общественно полезную инфу!!!1

——–
В акке yatools будет видно, от кого пришел лимит, в будущем это можно будет подтвердить отсылкой письма, и я сделаю хорошие плюшки ))

какие хорошие плюшки я буду м.б внедрять (все или частично) для тех, кто пожертвовал лимиты (кстати, их всегда можно забрать обратно) –

1. работа с crm.promosite.ru по некому числу запросов. Проверяет ежедневно позиции, генерит договора, отчеты, конкурентов по набору запросов, генерит готовые договора с ценами и тп, позволяет клиенту входить и люоваться на позиции и отчеты.

2. либо полный и более удобный доступ к сервисам (без капчи, пробивка пачками запросов), либо я даже чужим (свежерегам) это отключу – ну, ибо нех.

3. планировал и планирую вводить новые сервисы – там оченно много пробивки нужно будет – по входящим ссылкам на сайты по ЯВМ, по работе с базой ссылок рунета по вашему набору запросов.

4. Доска почёта на tools с перечнем хороших людей )

Но, конечно, я пока не знаю, что как будет – главное, что пожертованные лимиты остаются под вашим контролем, их всегда можно обратно отозвать.

Плиз, передайте лимиты Яндекс.XML на акк yatools

Обязуюсь все дела хранить в секрете, если нужно – никому ничо кто где чей сайт – не расскажу

buki.yandex c Островами

сами-то буки были доступны несколько дней назад, но поиск не работал.
Сейчас отдельно выложили http://buki.yandex.ru/ и http://buki.yandex.com/ – этот с Островами

1. непонятно, зачем оба выложили
2. не нашел никаких сайтов с Островами для примера

Яндекс.Острова – к июлю

По описанию на Yac/m – что-то типа визуального СПЕКТРа, но с возможностями для владельцев сайтов – предоставлять информацию и делать действия на серпе.

На бете http://beta.yandex.ru/ – там интерфейс входа, только он еще не работает.

Для владельцев сайтов настройки http://interactive-answers.webmaster.yandex.ru/ – наверное, к июлю хотят набрать базу вебмастеров, настроивших облака.

ИМАТ-2012 – сознались окончание 22 декабря

Яндекс боится чего? Дык, что все юзеры с него свалят.
А чтобы не сваливали, надо – что? Хорошо искать? 🙂 Улучшать релевантность?

Нене, зачем какие-то промежуточные задачи решать? Ставим сразу окончательную задачу – чтобы пользователи не сваливали!!!1
Интернет-математика 2012 как раз про это. Нафиг оптимизировать никому не нужные релевантности? Ерунда какая-то. ))

Цель этого конкретного конкурса — предоставить всем желающим возможность продолжить исследования пользовательского поведения и научиться предсказывать наличие определенного действия пользователя в поисковой сессии. В частности, этот конкурс сосредоточится на предсказании факта того, что пользователь воспользовался более чем одной системой поиска в рамках конкретной поисковой сессии.
***
Закрытие регистрации: 15 декабря, 2012 (UTC +4)
Завершение конкурса: 13:00, 22 декабря, 2012 (UTC +4)

Полный рандом дает качество около 0.5
Второй нах 🙂