…является изменением куска алгоритма.
Апдейт: тема тут.
Изменение выдачи видно:
http://www.web-it.ru/tools/seo/up/yandex/
http://pr-cy.ru/update/
Однако выкладывания проиндексированных текстов (=ссылок) не замечено:
http://tools.promosite.ru/updates/
http://ivanov.in/yandex-updates/
Месяц: Июнь 2008
Интервью Садовского
…на Сеоньюсе. Сначала подумал, что сеоньюсовцы вопросы задавали, к середине понял, что из форума SE собирали…
Особо заинтересовало:
Здравствуйте. Скажите, пожалуйста, после смены алгоритма какие факторы влияют на ранжирование больше? Морды или статьи? Или, может, одинаково? Или что-то другое вообще? Ответьте, пожалуйста, чётко, без околотемных слов, то, что влияют ссылки, это итак понятно. Заранее благодарен.
Объясню (четко и без «околотемных слов»), почему не могу ответить на Ваш вопрос так, как Вы этого хотите.
Во-первых, влияние факторов меняется со временем, мы постоянно перенастраиваем формулу релевантности. В ранжировании используется машинное обучение на основе данных асессоров. Если, предположим, ссылки на большинство релевантных страниц исчезнут в небытие, ссылочные факторы после обучения алгоритма станут менее весомыми. И наоборот. Между большими изменениями программы («Магадан», «Находка» и т.д.) перенастройка может происходит многократно.Во-вторых, важно влияние не столько каждого отдельного фактора, сколько их сочетания, которое зависит от ответа (страницы, сайта и т.д.) В формуле ранжирования каждый фактор участвует не сам по себе, а в какой-то комбинации с другими факторами. Если, предположим, фактор А, основанный на ссылках, имеет большой вес, а фактор Б у страницы отсутствует, то, если в итоге машинного обучения для расчета релевантности А и Б оказались тесно связаны, бесполезно будет наращивать вес фактора А, не предприняв усилий в отношении Б. В-третьих, для ответа на Ваш вопрос придется детально рассказать именно о факторах. Ссылочный граф – это источник данных. Текст страницы – еще один. Таких типов данных совсем немного. Но из каждого из них можно извлечь много факторов, позволяющих оценить какой-то аспект релевантности. Наращивание ссылок может приводить одновременно к уменьшению одного ссылочного фактора и увеличению другого.
-все ж таки простой "формулой ранжирования" обойтись не получится… Получится табулированный набор коэффициентов для каждого дискретного "соотношения факторов".
В последнее время в выдаче по низко- и среднечастотным запросам стали появляться сайты, которые не содержат на странице вхождения ключевого запроса, а их Title в выдаче Яндексом формируется из текста внешней ссылки, которая стоит на этот сайт. По Вашему мнению, данный Title должен повышать привлекательность ресурса для пользователя или это нововведение сделано по каким-то другим причинам?
Мы не наблюдаем данное явление. Пришлите, пожалуйста, пример запроса и скриншот страницы с результатами поиска.
-отожгли оба, и вопрошающий, и Садовский. 🙂 Один "недавно начал замечать", а второй "не наблюдает данное явление". 🙂
Вопрошающий, наверное, забыл сказать, что у сайта в выдаче пустой тайтл. Я такую хрень видел в октябре 2005 и в феврале 2006 – если тайтла нет и сайт НПС, текст ссылки отображаетсявместо него.
Кстати, разыскивая страницы своего блога, очень удивился – яндекс знает 77 страниц, хотя постов там ~450. Сначала думал, глубже нескольких уровней – забывает страницы. Потом проверил – нашел ажно 4 страницы с постами. Жопа какая-то у них там.
Из ответа Садовского:
Ссылки классифицируются по множеству признаков, и оценка является вероятностной. Чем выше вероятность, что ссылка является SEO, тем меньше будет ее вес. Но если нет полной уверенности, поисковый алгоритм учитывает ссылки, хотя придает им небольшое значение.
-вероятности… Пейджранк – вероятность посещения, тут вероятности ссылки, аббревиатуры учитываютс с вероятностями… Вероятность того, что страница соответствует запросу. 🙂
Кстати, насчет вероятностей. Представим себе запрос типа "название товара". Вероятнее ли будет вероятность соответствия, если сайт – магазин? А как повысить вероятность того, что сайт – магазин? Словами "купить, корзина, заказ" и прочее. Не связанными с запросом. Надо обдумать.
Вы объявили, что Яндекс стал понимать транслитерацию в ссылках. Какой именно используется стандарт?
При транслитерации слова в название URL могут использоваться разные стандарты, поэтому при антранслитерации мы смотрим на несколько стандартов. Сгенерированные гипотезы оцениваем на правдоподобность и проверяем по словарю.
-Я чего-то не понял, про транслитерацию в урле или в тексте ссылки идет речь. В урле давно есть, а что, он об этом спецом объявлял? Да и в тексте ссылки давно есть. К чему это все?
Заметил, что при продвижении новых сайтов ссылки начинают не сразу работать на всю силу. Так ли это? Что нужно сделать, чтобы сайт не попал в "новичок"?
Мы учитываем в ранжировании далеко не все ссылки, которые находятся на проиндексированных страницах. Возможно, именно эта особенность алгоритма была интерпретирована Вами как отложенная «работа» ссылок.
-не все ссылки… вероятности…
Кого вы больше не любите: оптимизаторов или людей, торгующими ссылками. Есть ли у вас планы на Sape?
Людей я люблю, хотя результаты их деятельности мне не всегда по душе.
Планы на Sape? В народе говорят, готовь Sape с лета… 🙂
-Садовский как бы хочет сказать нам, что ссылки будут работать через полгода после установки 🙂
Как Яндекс относится к IDN доменам SU? Их индексация наравне с RU. Если использовать ключевик в названии домена, будет это учитываться при ранжировании?
Мы уже индексируем эти домены наравне с .ru. Ключевое слово пока не учитывается в ранжировании. Сейчас для таких доменов еще не работают операторы host, url и аналогичные, но скоро это будет исправлено.
-прикольно, насчет ключевиков в host="" 🙂
Как вы планируете улучшать алгоритм поиска? Собираетесь ли вводить новые технологии? Какие сервисы планируются в релиз на ближайшее время?
Мы постоянно вводим новые технологии и улучшаем алгоритмы. В ближайшем обновлении поисковой программы мы добавим новые факторы ранжирования, такие, как уникальность контента, классификатор порнографии, геоклассификатор запроса и многие другие.
-о как. Уникальные генеренные дорвеи будут рулить марковские 🙂
… и еще: почему вопрос Людкевича "когда будем пить" не попал в "вопоосы о будущем"? 😀
Про аббревиатуры и прилагательные в Яндексе
красиво, подробно расписывают…
Довольно много, 6-8% запросов:
Использование новых расширений слов запроса суммировано в следующей таблице:
Переход из одной части речи в другую — 17182 пар слов, 6% запросов
Транслитерация — 25455 пар слов, 8% запросов
Аббревиатуры — 19360 пар слов, 1,5% запросов
Интересный "переход из одной части речи в другую":
московские работа
московские знакомства
московская продажа
– везде слово "москва" выделено и учтено. А в московские окна – не выделено 🙂
яндекс показывает кириллические домены
Пример: "окна su":
http://xn—-7sbbgpqmf1aiqn6k.su/
найден по ссылке: красивые-окна.su…
красивые-окна.su
http://xn—-7sbbgobsawdlngm6qpb.su/
найден по ссылке: алюминиевые-окна.su…
алюминиевые-окна.su
http://xn—-7sbbgpqodc1agde4ap2m.su/
найден по ссылке: пластиковые-окна.su…
пластиковые-окна.su
Однако по ссылке на кириллический урл (пример: url="пластиковые-окна.su") сайты не находятся.
Гугель, кстати, раньше начал находить IDN домены.
PS Я тоже считаю, что кириллические домены – говно, а тем более в зоне SU. Ни одного не купил. Я вообще считаю, что наш КЦ (координационный центр) нас наёбывает нипадеццки… Взять хотя бы бывшую эпопею – с "транслитными дублями" доменов, типа собирались ввести кириллицу в РУ и их собирались "приоритетно регистровать" на владельцев транслитных дублей. Куча народу повелась, и тов. Денискин по туризму…
Я-то ладно – 1. опоздал к раздаче и 2. очень хорошо, что опоздал, зарегал штук 10-15 транслита.
А ведь иные люди (jsc "russobalt") попали на кучу транслитных доменов.
Так что нашим мудакам я не верю принципиально.
Домены с олимпийскими названиями будут отбирать?
Нет, я слышал, что в Сочах передел недвижимости был… Получается, и до доменов докатилось?
Вот люди жалуются: http://forum.searchengines.ru/showthread.php?t=238026
Итак, вот информация с официального сайта Сочи-2014:
В соответствии с Федеральным законом № 310-ФЗ от 01.12.07 к Олимпийской и Паралимпийской символике относятся:
Наименования «Олимпийский», «Олимпиада», «Сочи 2014», «Olympic», «Olympian», «Olympiad», «Olympic Winter Games», «Olympic Games», «Sochi 2014» (и образованные на их основе слова и словосочетания)http://sochi2014.com/34359
Исключительное право на товарный знак может быть осуществлено для индивидуализации товаров, работ или услуг, в отношении которых товарный знак зарегистрирован (в соответствии с классами Международной классификации товаров и услуг, что обязательно указывается в свидетельстве на товарный знак), в частности путем размещения товарного знака:
…
5. в сети Интернет, в том числе в доменном имени и при других способах адресации.http://sochi2014.com/32366
И сразу хочу ответить на вопрос о том, будут ли преследовать. Ответ будут!
Сегодня мне позвонили на сотовый из ОргКомитета игр:
(ОК)- Вы администратор домена sochi-2014.biz?
(я) – да
(ОК) – настоятельно рекомендует прекратить незаконное использование олимпийской символики, в противном случае это будет сделано через суд.Далее менее содеражтельная часть разговора.
Думал меня развели – но когда забил номер телефона в Яндексе – офигел!
+7 (495) 739 46 49 – http://sochi2014.com/sch_contacts_ruТак, что большенству из http://forum.searchengines.ru/showthread.php?t=150407 придется сайты закрывать…
Хотя вообще закон про ТМ вроде говорит, что если название, сходное с ТМ, использовалось ДО регистрации ТМ, то его можно продолжать использовать “в том же объеме”. Что тут считать датой регистрации… Дату принятия закона, что ли?
Мастерхост – уроды… Который раз…
Взяли и сменили путь к php-скриптам 23 мая… Из-за этого cron перестал работать…
И не предупредили, конечно… зато регулярно их девачки звонят "нет ли проблем с оплатой"…
Причем даже в доке своей накосячили – написали путь /usr/local/apache-php4/bin/php-cli, а он вовсе и другой – /usr/local/php4/bin/php-cli, по аналогии с php5 подобрал…
Ненавижу….
Прямая ссылка: уроды, кретины, козлы… 🙂
XSS запросы – их виды
Нет, понятно, что тема XSS в плане тИЦ умерла, но людям зачем-то это еще надо… Парсят.
На знакомый сайтик, где самодельный счетчик стоит и берет рефререр из яваскрипта как document.referrer, присылают интересные переменные вместо этого рефререра:
1 ' " ' X S <> -- 2-1 and 1=1 2 and 1=1 ' and '1'='2 " and "1"="1 " and "1"="2 XSS@<xscript>XSS</xscript>.com XSS@%3cxscript%3eXSS%3c%2fxscript%3e.com java:xscript(XSS) myvalue" myattribute="java:xscript(XSS)" myvalue myattribute=java:xscript(XSS) myvalue' myattribute='java:xscript(XSS)' XSS@+xscript-XSS+/xscript-.com ><!-- '><!-- "><!-- \n\nPTHeader: PTValue /boot.ini ../../../../../../../../../boot.ini /windows/win.ini ../../../../../../../../../windows/win.ini /filename.php /filename.php. /filename.php filename.php filename.php. filename.php |id| `id` ;id;
-(где filename – файл скрипта счетчика).
Мне многое незнакомо (особенно проверка на винды, ведь на сервере не винды), но все же интересно.
Что означают \n\nPTHeader: PTValue? И вот это все: XSS@<xscript>XSS</xscript>.com
Если кто в теме, просветите плз.
операторы link и anchor в pda.yandex.ru…
…оказывается, работали.
Но недолго. 🙂