…на Сеоньюсе. Сначала подумал, что сеоньюсовцы вопросы задавали, к середине понял, что из форума SE собирали…
Особо заинтересовало:
Здравствуйте. Скажите, пожалуйста, после смены алгоритма какие факторы влияют на ранжирование больше? Морды или статьи? Или, может, одинаково? Или что-то другое вообще? Ответьте, пожалуйста, чётко, без околотемных слов, то, что влияют ссылки, это итак понятно. Заранее благодарен.
Объясню (четко и без «околотемных слов»), почему не могу ответить на Ваш вопрос так, как Вы этого хотите.
Во-первых, влияние факторов меняется со временем, мы постоянно перенастраиваем формулу релевантности. В ранжировании используется машинное обучение на основе данных асессоров. Если, предположим, ссылки на большинство релевантных страниц исчезнут в небытие, ссылочные факторы после обучения алгоритма станут менее весомыми. И наоборот. Между большими изменениями программы («Магадан», «Находка» и т.д.) перенастройка может происходит многократно.
Во-вторых, важно влияние не столько каждого отдельного фактора, сколько их сочетания, которое зависит от ответа (страницы, сайта и т.д.) В формуле ранжирования каждый фактор участвует не сам по себе, а в какой-то комбинации с другими факторами. Если, предположим, фактор А, основанный на ссылках, имеет большой вес, а фактор Б у страницы отсутствует, то, если в итоге машинного обучения для расчета релевантности А и Б оказались тесно связаны, бесполезно будет наращивать вес фактора А, не предприняв усилий в отношении Б. В-третьих, для ответа на Ваш вопрос придется детально рассказать именно о факторах. Ссылочный граф – это источник данных. Текст страницы – еще один. Таких типов данных совсем немного. Но из каждого из них можно извлечь много факторов, позволяющих оценить какой-то аспект релевантности. Наращивание ссылок может приводить одновременно к уменьшению одного ссылочного фактора и увеличению другого.
-все ж таки простой "формулой ранжирования" обойтись не получится… Получится табулированный набор коэффициентов для каждого дискретного "соотношения факторов".
В последнее время в выдаче по низко- и среднечастотным запросам стали появляться сайты, которые не содержат на странице вхождения ключевого запроса, а их Title в выдаче Яндексом формируется из текста внешней ссылки, которая стоит на этот сайт. По Вашему мнению, данный Title должен повышать привлекательность ресурса для пользователя или это нововведение сделано по каким-то другим причинам?
Мы не наблюдаем данное явление. Пришлите, пожалуйста, пример запроса и скриншот страницы с результатами поиска.
-отожгли оба, и вопрошающий, и Садовский. 🙂 Один "недавно начал замечать", а второй "не наблюдает данное явление". 🙂
Вопрошающий, наверное, забыл сказать, что у сайта в выдаче пустой тайтл. Я такую хрень видел в октябре 2005 и в феврале 2006 – если тайтла нет и сайт НПС, текст ссылки отображаетсявместо него.
Кстати, разыскивая страницы своего блога, очень удивился – яндекс знает 77 страниц, хотя постов там ~450. Сначала думал, глубже нескольких уровней – забывает страницы. Потом проверил – нашел ажно 4 страницы с постами. Жопа какая-то у них там.
Из ответа Садовского:
Ссылки классифицируются по множеству признаков, и оценка является вероятностной. Чем выше вероятность, что ссылка является SEO, тем меньше будет ее вес. Но если нет полной уверенности, поисковый алгоритм учитывает ссылки, хотя придает им небольшое значение.
-вероятности… Пейджранк – вероятность посещения, тут вероятности ссылки, аббревиатуры учитываютс с вероятностями… Вероятность того, что страница соответствует запросу. 🙂
Кстати, насчет вероятностей. Представим себе запрос типа "название товара". Вероятнее ли будет вероятность соответствия, если сайт – магазин? А как повысить вероятность того, что сайт – магазин? Словами "купить, корзина, заказ" и прочее. Не связанными с запросом. Надо обдумать.
Вы объявили, что Яндекс стал понимать транслитерацию в ссылках. Какой именно используется стандарт?
При транслитерации слова в название URL могут использоваться разные стандарты, поэтому при антранслитерации мы смотрим на несколько стандартов. Сгенерированные гипотезы оцениваем на правдоподобность и проверяем по словарю.
-Я чего-то не понял, про транслитерацию в урле или в тексте ссылки идет речь. В урле давно есть, а что, он об этом спецом объявлял? Да и в тексте ссылки давно есть. К чему это все?
Заметил, что при продвижении новых сайтов ссылки начинают не сразу работать на всю силу. Так ли это? Что нужно сделать, чтобы сайт не попал в "новичок"?
Мы учитываем в ранжировании далеко не все ссылки, которые находятся на проиндексированных страницах. Возможно, именно эта особенность алгоритма была интерпретирована Вами как отложенная «работа» ссылок.
-не все ссылки… вероятности…
Кого вы больше не любите: оптимизаторов или людей, торгующими ссылками. Есть ли у вас планы на Sape?
Людей я люблю, хотя результаты их деятельности мне не всегда по душе.
Планы на Sape? В народе говорят, готовь Sape с лета… 🙂
-Садовский как бы хочет сказать нам, что ссылки будут работать через полгода после установки 🙂
Как Яндекс относится к IDN доменам SU? Их индексация наравне с RU. Если использовать ключевик в названии домена, будет это учитываться при ранжировании?
Мы уже индексируем эти домены наравне с .ru. Ключевое слово пока не учитывается в ранжировании. Сейчас для таких доменов еще не работают операторы host, url и аналогичные, но скоро это будет исправлено.
-прикольно, насчет ключевиков в host="" 🙂
Как вы планируете улучшать алгоритм поиска? Собираетесь ли вводить новые технологии? Какие сервисы планируются в релиз на ближайшее время?
Мы постоянно вводим новые технологии и улучшаем алгоритмы. В ближайшем обновлении поисковой программы мы добавим новые факторы ранжирования, такие, как уникальность контента, классификатор порнографии, геоклассификатор запроса и многие другие.
-о как. Уникальные генеренные дорвеи будут рулить марковские 🙂
… и еще: почему вопрос Людкевича "когда будем пить" не попал в "вопоосы о будущем"? 😀