Яндекс.Платоны о сроках склейки и расклейки зеркал

йоу, кажись прямая линия с Платонами, чото полезное написали.
Правда, у меня переклейка ни фига не выполняется. Роботс + 301 – результата ноль. Хорошо хоть сайт ненужный, экспериментальный.
О сроках переклейки/склейки и расклейки зеркал

Итак, сейчас склейка и переклейка зеркал занимает от 2 недель до 1,5 месяцев, причем ускорить этот процесс никакой возможности нет, так что я хоть и рад письмам, но не могу помочь, к сожалению. Всегда просто прошу набраться терпения и подождать. Со временем, конечно, мы эти сроки будем сокращать. Одноименные домены (site.ru и www.site.ru, отличаются только наличием www) уже переклеиваются быстрее, в течение 2–3 недель.

Теперь о расклейке зеркал. Если купленный домен оказался чьим-то зеркалом, то это совсем не повод расстраиваться. Разместите на домене сайт, и расклейка произойдет в течение 2 недель – все просто!

Вот краткая шпаргалка по срокам:

Расклейка – 2 недели;
Склейка/переклейка доменов с www и без – 2–3 недели;
Склейка/переклейка разноименных доменов – 1–1,5 месяца.

Я.склейка страниц перестала работать?

пример: url:holidaybest.ru/stihi-k-podarkam внутри сайта – дает одну и ту же страницу два раза – со слешом и без слеша.

Контент, очевидно, одинаковый, даже размер в байтах совпадает.
Это началось уже давно – я заметил осенью 2011, когда начал массово выкачивать проиндексированные страницы из яндекса.

Традиционно яндексом страницы склеивались и сапа, аналогично, слеш игнорирует на конце. И таких страниц много.

Мораль: покупая ссылку на такой странице – как бы покупаем эту ссылку с двух страниц ))

Что же со склейкой страниц произошло, почему не работает? Яндекс? )

перелинковочка зарулила?

есть у меня сайтик РФ-ный чисто для пробы зоны: http://что-означает.рф/
ну и там отпарсенные и сведенные в один словари, UTF-урлы русские.

в сумме 120 тыс. словарных статей, но всю дорогу не индексировалось больше 8-10 тыс., да и то – часто вылетало в АГС (дублей много, понятное дело).

и всю дорогу там посещалка была типа 20-50 хостов в день.

и тут вдруг: около 4-10 декабря 2011 посещалка резко подпрыгнула до 1.5-2К в день, в основном НЧ-запросы вида “что означает ***”, “значение слова ***”. Сайтик стал выдаваться. Сейчас посещалка растет, уже до 3К доходит, страниц тоже 80+К.

может, конечно, и просто отстялся (год как раз прошел), но я все-таки думаю на внутреннюю перелинковку.
***
Особенность сайта – что страницы слинкованы. Причем использованы хитрые алгоритмы :), и может создаться впечатление, что человек линковал – ссылки на соседние словарные статьи реально по теме. Но, конечно, все автоматом делалось.

Может, она и зарулила?
Есть ли у кого примеры за-против?

рассказ про Я.переформулировки, как я понимаю

Получение структуры для поисковых запросов на примере товарных запросов – Юлия Киселева (Яндекс) — cеминар 15.10.2011
как я понимаю, про переформулировки и как их делают.
понятно, не вручную, если ~10% запросов было размечено.
тут уже почти прямым текстом про то, что переформулированный запрос отрабатывает вместо введенного.
***
про учет кликов юзера по выдаче в выборе расширений запроса.
ну с товарами все-таки понятнее, есть четкая структура с брендами, характеристиками и прочим, да и базы для обучения. А для остальных запросов?

кстати в видео упоминался какой-то слив (видимо, размеченных переформулировок) от 2005 года. Жаль, не мне ))

спс g00dman

переоптимизация или юзабилити?

Странно. Яндекс сообщал, что буки были открыты для тестирования "изменений ранжирования коммерческих сайтов московского региона".

Теперь они сказали, что выложен учет юзабилити сайтов (прямо в выдачу сразу без тестирования? или это и есть те самые изменения ранжирования?), но при этом вроде как выложил и учет переоптимизированных текстов сразу в выдачу.

В письмах в ЯВМ пишут (1) и (2), что "мы обновили поисковый алгоритм":

Как мы уже писали ранее, поисковая система Яндекс отдает предпочтение сайтам, которые нравятся и удобны пользователям, и негативно относится к попыткам повышения релевантности страниц сайта за счет чрезмерного употребления ключевых слов (слов запросов) в текстах. Мы обновили поисковый алгоритм, влияющий на ранжирование страниц, содержащих чрезмерно переоптимизированные тексты, которые предназначены в первую очередь не для пользователей, а для влияния на поисковую систему. Мы считаем, что такие тексты трудночитаемы и малоинформативны для пользователей, а значит, не являются хорошим ответом на запрос.

По мнению алгоритмов Яндекса, на страницах Вашего сайта имеются переоптимизированные тексты, поэтому позиции этих страниц в выдаче могут ухудшиться.Мы рекомендуем Вам пересмотреть контент Вашего сайта, отталкиваясь от интересов и удобства посетителей.

Когда проблема будет устранена, страницы автоматически восстановят свои позиции

Кстати, явно этот фактор (про переоптимизированность) не дискретный, а непрерывный. Т.е., по некоторым сайтам письма не приходили, а позиции съехали. Переоптимизированность недостаточная для отсылки письма 🙂 (хотя есть вариант, что малое число страниц переоптимизировано)
Или это пока предупреждения только? а выкатили только юзабилити?

лекции Расковалова в Екатеринбурге

http://habrahabr.ru/blogs/study/128882/ и http://compsciclub.ru/courses/informationretrieval

С 30 сентября по 2 октября 2011 года в Computer Science клубе в Екатеринбурге Ден Расковалов (Яндекс), один из ведущих российских специалистов по поисковым системам и вопросам качества поиска, прочтёт бесплатный курс лекций «Информационный поиск изнутри».
***
На сайте http://uralcsclub.onwebinar.ru/ будет организована живая интернет трансляция.

1. Архитектура поискового кластера (30.09.2011 – 18:00 – 19:20)
2. Архитектура поискового кластера (30.09.2011 – 19:30 – 20:50)
3. Современные методы улучшения релевантности информационного поиска (01.10.2011 – 18:00 – 19:20)
4. Современные методы улучшения релевантности информационного поиска (01.10.2011 – 19:30 – 20:50)
5. Современные методы увеличения производительности информационного поиска (02.10.2011 – 18:00 – 19:20)
6. Современные методы увеличения производительности информационного поиска (02.10.2011 – 19:30 – 20:50)

google: X-Robots-tag для не-хтмльного контента

предотвращение индексирования при помощи заголовка HTTP X-Robots-tag

Эффект тот же самый, как и при использовании мета-тега noindex, но этот приём особенно полезен для нетекстового содержимого, когда нет возможности разместить мета-тег в исходном коде. Ниже приведён пример применения тега X-Robots-tag в заголовке HTTP-ответа, позволяющего запретить индексацию страницы.

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)

Дополнительные сведения об использовании тега X-Robots-tag можно найти на сайте code.google.com (на английском).

у яндекса запрета на индексацию хттп-заголовками нету.
а что – как раз избранная неиндексация картинок и тп., документов doc

типы файлов в урловых операторах

теперь опять подкрутили – в операторе domain:ru в топе не-хтмл-типы документов.
doc, xls, swf, rtf

видимо, сегодняшнее изменение. и еще длинные запросы прилично поменялись, мб чото с цитатным поиском, или с текстовым поиском (неконкурентные запросы изменились сильнее)

быстроробот в урловых операторах

а быстроробота в операторах типа domain отменили с четверга на пятницу 9-10

Но остального изменения не коснулись, изменений по другим запросам нет. Получается, точечно подкрутили запросонезависимую часть формулы.

Анонс: скоро у меня будет анализатор откатов. Будет пробиваться похожесть выдачи сегодня и в прошлое. Тогда легче будет понять, что к какому состоянию откатилось.