Рейкьявик – начинают персонализацию поиска, получается

Рейкьявик — новая поисковая платформа Яндекса
Ну так-то понятно, что по каждому пользователю возникает еще один параметр – "англоязычные ли сайты он ищет".
Т.е. если использовать наработанные методики с обучением, то уже на вход обучалке надо подавать не набор пар (запрос – результат), а набор троек (запрос – фактор языковых предпочтений – результат).
Я так понимаю, что это было бы слишком сильным изменением, если бы было так. Вряд ли это так.
Значит, просто формула делится на две половинки – одна для русскоязычных языковых предпочтений, другая – для западных. Интересно, откуда данные будут брать – это же нативных людей с запада брать нужно.
Ну, очевидно, что асессорских данных меньше и в формуле с англопредпочтениями будет адский адъ.
ЗЫ Кстати, странная должность Расковалова – что это еще за "отдел разработки качества поиска"? разрабатывают качество?

Интернет, 17 августа 2011 года. Яндекс запустил новую поисковую платформу — «Рейкьявик». Она учитывает языковые предпочтения пользователя. Теперь люди, которые чаще ищут англоязычные ресурсы, будут видеть в результатах поиска больше ссылок на них, и наоборот. Это первый шаг Яндекса в направлении персонализации поиска.

«По статистике Яндекса, большинство пользователей предпочитают ответы на родном языке. Но есть и те, кто ищет именно англоязычные ответы, — говорит Денис Расковалов, руководитель отдела разработки качества поиска. — Мы много экспериментировали, пытаясь найти наилучший способ удовлетворить потребности и тех, и других. В результате мы решили научить поиск учитывать языковые предпочтения пользователей и подстраиваться под них».

«Рейкьявик» обращает внимание только на запросы на английском языке. Он отфильтровывает латинскую транслитерацию русскоязычных запросов, адреса сайтов, ошибки раскладки клавиатуры и т.д. При этом сам англоязычный вопрос не всегда означает поиск такого же ответа, например, по запросам [beatles”> или [rothko”> человек может искать и русские сайты. «Рейкьявик» учитывает, часто ли пользователь открывает из результатов поиска веб-страницы на английском.

Информация о том, нужны ли пользователю англоязычные ресурсы, используется при ранжировании. И если нужны, человек видит среди первых результатов поиска больше ссылок на них. По данным «Рейкьявика», ответы на английском языке предпочитают около 8% пользователей Яндекса.

вольности при платном принятии в Я.Каталог

С удивлением обнаружил, что при ПЛАТНОМ добавлении в ЯК редактор сам переписывает по-своему текст ссылки и описания. Удивился несказанно. Ну и раздел выбирает, но это ладно.

Полез в оферты и убедился, что там так и написано:

Описание – составленное сотрудниками Яндекса описание информационного ресурса (сайта) в сети Интернет, включающее название такого сайта (полное или сокращенное), содержащее гипер-ссылку на такой сайт и характеризующее его содержание в соответствии с требованиями Правил.

Блин, а на какого тогда требовать введения текста ссылки и описания? Создается впечатление, что текст должен быть ровно тот же, добавленный.

Кстати, по первому разу promosite.ru в ЯК не взяли за "поисковый спам". После того, как я удалил метатегом несколько статей, которые выводились по группе запросов типа "как создать свое дело", сайт взяли. Там для иллюстрации списки запросов тематические были )) Вроде как для людей, но если в ЯК добавиться, вообще топ1 небось был бы, а им не хотелось 🙂
===
А кто мониторит ЯК? Видели какое описание у БДБД? Когда оно поменялось?

"Bdbd.ru" – услуги интернет-рекламы и маркетинга
Организация комплексных рекламных кампаний в интернете; анализ, оптимизация и продвижение сайтов в поисковых системах. Информация об агентстве. Статьи.

Что-то мне сомнительно, что они сами составили такое описание, где нет в ссылке ничего про продвижение сайтов. Кажется, что у всех топовых буквально был фрагмент типа "САЙТ.РУ – раскрутка и продвижение сайтов". А тут как будто специально нужные слова вычистили из текста.

Прошлись и переписали описания у всех? Или только БДБД мочат по всем фронтам?

яндекс-выдача по несколько разультатов с сайта

как у гугла.
пример:

#1 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru Москва копия

#2 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru›Htms/About_Weleda.htm Санкт-Петербург копия

#3 Веледа – антропософская медицина натуральная медицина гомеопатия…
weleda.ru›Htms/Medicine.htm Санкт-Петербург копия

Все результаты с сайта weleda.ru

via komdir
+ пример по irr.ru

google: X-Robots-tag для не-хтмльного контента

предотвращение индексирования при помощи заголовка HTTP X-Robots-tag

Эффект тот же самый, как и при использовании мета-тега noindex, но этот приём особенно полезен для нетекстового содержимого, когда нет возможности разместить мета-тег в исходном коде. Ниже приведён пример применения тега X-Robots-tag в заголовке HTTP-ответа, позволяющего запретить индексацию страницы.

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)

Дополнительные сведения об использовании тега X-Robots-tag можно найти на сайте code.google.com (на английском).

у яндекса запрета на индексацию хттп-заголовками нету.
а что – как раз избранная неиндексация картинок и тп., документов doc

украли 50 млн? кто? неизвестно? ну, тогда – пропали.

адская статья с заголовком В Москве неизвестные похитили из банка 50 млн рублей

В одном из коммерческих банков Москвы в пятницу, 22 июля, неизвестные похитили почти 50 млн. рублей. Об этом сообщает радиостанция "Маяк", ссылаясь на источник

по этой теме мне вспоминается фельетон (?) тов. Булгакова "Воспаление мозгов"

Передо мною не было адмирала и Черномора и не было моих часов в кармане брюк.
Я пересек улицу и подошел к милиционеру, высоко поднявшему жезл.
– У меня часы украли сейчас, – сказал я.
– Кто? – спросил он.
– Не знаю, – ответил я.
– Ну, тогда пропали, – сказал милиционер.
От таких его слов мне захотелось сельтерской воды.

украли 50 млн? кто? неизвестно?
ну, тогда не украли, а пропали 🙂

Посоветуйте мануалы про модели просмотра веб-страницы юзером

Есть ли что-то по возможным моделям просмотра страниц пользователем? Куда он смотрит, в каком порядке просматривает части страницы, как принимает решение о дальнейших действиях?

добавления в апометр

в апометре http://tools.promosite.ru/updates/ добавления – начал писать и показывать текстовые комментарии к апдейтам (сейчас есть 9 июля). не знаю, как их дальше писать и откуда брать.

юзерам, что ли, позволить камменты писать. Так мата не оберешься )) Или вип-группу какую нить сделать.

второе – начал таки показывать какую-то цифирь про апдейты той части поведенческих факторов, которые берутся из учета кликов по выдаче. Метод простой (спасибо за наводку Стасу:) )) Смысл цифири – когда выдача с учетом кликовых ПФ апдейтится сильнее, чем без них – цифирь больше 50%, максимум 100. Смысл – слабые изменения запроса, когда по сути выдача должна быть такой же, но в явном виде люди такой запрос не набирают. Когда обе выдачи апдейтятся одинаково сильно – цифирь примерно равна 50% и не показывается. Сейчас есть ап 17 мая, когда выдача с ПФ апнулась сильнее, чем без них.

сегодня в 13 запланирован мой рассказ про апометры и тд. на мегаиндексе (ссылку на анонс дать невозможно, бгг), фотография какая-то странная только.

в виджет и рсс пока не вставлено, потом вставлю.

художественный рерайт

…с потерей смысла.

исходник: штрафу подвергнуты именно страницы, не домены, т.е. перенести и восстановится, если не будет нового штрафа

рерайт с потерей смысла (блог мегаиндекса): наказанию подвергнуты не домены, а страницы, то есть перенести страницы на новые домены, не получится. Штраф останется.

***
интересно еще, а как это – перенести страницы на новые домены 🙂 особая уличная магия – переносим на другой домен без смены урла.
***
бгг. в исходнике-то мы переносили продвигаемые слова с зафильтрованной страницы на другую, а в рерайте стали переносить страницы на новые домены.