Ссылочное ранжирование в Яндексе: страницы или сайты?

Был у меня когда-то на searchengines.ru спор с Серегой Людкевичем на предмет того, наследуется ли ссылочное ранжирование, направленное на “морду” сайта – для других (внутренних) его страниц? Я говорил – да.
Я тогда находил в Яндексе по конкурентным запросам (по которым не пробиться за счет текстовых факторов) – внутренние страницы разных сайтов. Прямых ссылок извне на которые не было. Среди страниц были такие, даже ВНУТРЕННИЕ ссылки на которые были совсем “не с теми словами”.
А страницы эти выдавались. Релевантность по тексту у них была явно выше, чем у морды. Плюс “наследуемое” якобы с морды ссылочное ранжирование.

Теперь вот нашел похожий пример, только в нем наоборот: ссылочное ранжирование, направленное на внутреннюю страницу – играет для главной!
Ищем в Яндексе “Ссылка на” – находим первой страницу:

SVEN
текст ссылок: Ссылка на описание… Ссылка на сайт производителя…
www.sven.ru (25 КБ) 10.02.2004 — найден по ссылке

Ищем тогда, кто на него ссылается этим словом: anchor#link=”www.sven.ru*”[ссылка] – находим на втором месте:

Интернет-магазин: компьютеры, комплектующие, связь – Ярославль
Самый большой интернет-магазин в Ярославле: компьютеры, комплектующие, аксессуары, оргтехника, торговое оборудование. Покупка в кредит, скидки. Связь, сети, программы и многое другое.
Ссылка на описание
shop.tensor.ru/price/item.php?id=89442 (12 КБ) — строгое соответствие

Собственно, в “сниппете” показыватся 2 фрагмента – которые и показаны в сниппетах ссылающихся (места 2 и 3) – “Ссылка на описание”, “Ссылка на сайт производителя”. Оттуда и берется.
Но на странице http://shop.tensor.ru/price/item.php?id=89442 – ссылка с этими словами указывает на внутреннюю страницу сайта sven: http://www.sven.ru/product.asp?prod=689&cp=1&cat=82 , которая к тому же дает ошибку 404 (не проверял, действительно ли хедер 404, но страницы нет в базе Яндекса, да и скорее там 3XX, раз редирект идет).
Итак, текст ссылки на внутреннюю страницу сайта учтен при ссылочном ранжировании его морды. Абалдеть.

Учет описания из Яндекс-каталога

Вроде бы некоторое время назад в http://yaca.yandex.ru/robots.txt Яндекс-каталог в основной части (/yca/cat/) был открыт для индексации. А теперь – всем открыт, он Яндексу – закрыт:

User-Agent: yandex
Disallow: /yaca/
Disallow: /yandsearch
Disallow: /yandpage
Disallow: /norobot
Disallow: /yca

User-Agent: *
Disallow: /yaca/
Disallow: /yandsearch
Disallow: /yandpage
Disallow: /norobot
Disallow: /yca/…
Disallow: /cy

Ну и верно, страниц, проиндексированных Яндексом, там нет: #url=”yaca.yandex.ru/yca*”.
А поскольку он закрыт, он точно не может влиять на поиск за счет ссылочного ранжирования и своего вИЦа. Значит, можно считать доказанным, что он учитывается отдельно, своим хитрым способом.
сбор и обмен научной и технической информации, подключение школ к Интернет

RELARN – Home page
текст ссылок: Об ассоциации и ее проектах сбор и обмен научной и технической информации подключение школ к Интернет финансовая техническая и др поддержка участников … …
www.relarn.ru:8080/ (9 КБ) — найден по ссылке
Похожие документы · Рубрика: Крупные объединения, ассоциации

С описания в категории Крупные объединения, ассоциации.

Кнопа в Яндекс-каталоге и слепые клики

Заходим в рубрику Каталог / Бизнес и экономика / Строительство и ремонт – и видим рядом с кнопкой “Найти” кнопку “ключ-пластконструктор”:

По сообщению не скажу каких источников, это “спонсорство” – в прайсе этого нет. Стоит порядка десятков тысяч уё.

Этак дальше Яндекс начнет клики на категории продавать. Или рекламу прямо на кнопке “найти” разместит 🙂
Интересно, а сколько будет стоить создание категории ЯК “про себя любимого”?

Беспечные люди – банкиры…

Обнаружил у себя в рассылке http://links.obgon.ru/expired.php?2004-07-21 свободный домен с тИЦом 350: devon-credit.ru. Да, это зеркало devoncredit.ru, т.е. покупать нет смысла вроде бы.

Только на это зеркало ведут 57 ссылок из суммарных 78.
Т.е., на основной домен указывает треть всех ссылок, а основная масса-на брошенный. А татарским банкирам-то по фигу.

работники х… и п…

По работным запросам наткнулся на кучку дорвеев: от http://1.crutop.ru/ до http://8.crutop.ru/ . Характерно – до ста страниц на домене.
Интересно, кто надоумил?

А кеш Яндекса – то другой, не такой простой!

Оплата – 0.9 цента работа для молодежи в уфе за показ, для каждой из программ или 0.54$ в час (это работа для молодежи в уфе 54 points ). работа для молодежи в уфе Самый простой этап – это получение чека. Когда на вашем работа для молодежи в уфе счету накопится сумма равная или больше минимальной вам вышлют чек, некоторые работа для молодежи в уфе спонсоры уведомляют об этом письмом по E-Mail

для 7.crutop.ru/rabota_dla_molodezi_w_ufe.html

Блоки ссылок и поиск по $anchor

Думал посмотреть, сколько слов с длинной ссылке играют роль. Кстати, наспамьте в камментах кто может: урлов сайтов, на которых есть длинные, очень длинные ссылки (внутренние или внешние, неважно).

Ну, думал, сейчас найду такие сайты с помощью чего-то типа $anchor(сайт / 10 сайт). И вижу первым:

создание сайтов
… сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web- …
www.kottedgi.ru/art_2.html (8 КБ) 20.04.2004 — совпадение фразы
Найденные слова · Похожие документы

Захожу на этот дорвейчик. Внизу видна гора ссылок:

создание сайтов cjplfybt cfqnjd компьютерная помощь ремонт компьютера ремонт компьютеров компьютеры ремонт ремонт компьютеров москва москва ремонт компьютеров ремонт пк ремонт компьютера в москве ремонт pc ремонт компьютеры ремонт компьютора ремонт компьютра ремонт кмпьютера ремонткомпьютера настройка компьютера настройка компьютеров установка windows установка windows 98 переустановка windows windows 98 установка windows98 настройка windows переустановка windows 98 виндовс установка windows xp операционные системы windows xp установка windowsxp установка ос установить windows переустановка windows xp установка программы локальная сеть установка драйвера настройка модемов создание сайта как создать сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web-дизайн веб-дизайн создание своего сайта создание web-сайтов создание web сайта создание веб сайта создание веб сайтов создание сайтв сздание сайтов созданиесайтов cjplfybt cfqnf htvjyn rjvgm.nthjd htvjyn rjvgm.nthf yfcnhjqrf rjvgm.nthjd yfcnhjqrf rjvgm.nthf cjplfybt cfqnf cfqn rjvgm.nth rjvgm.nths htvjyn cfqns цштвщцы ctnm ctnb vjltv vjltvs помощь компьютер скорая компьютерная помощь компьютерная скорая помощь компьютернаяпомощь вызов мастера по ремонту компьютера вызов мастера по настройке компьютера вызов мастера по установке windows вызов мастера по установке программ вызов мастера по настройке модема вызов мастера по созданию сайта

Причем все ссылки короткие, в пару слов. Как же Яндекс нашел эту страницу?
Поскольку для поиска по текстам ссылок необходимо иметь индекс по словам из текстов ссылок:
Варианта два.
1) Яндекс может объединять все стоящие рядом ссылки в одну – сначала меня проперло по этому варианту – хороший был бы способ борьбы с блоками ссылок… Но потом поостыл. Слишком экстремально. Хотя надо подумать.
2) Яндекс может хранить индекс по текстам ссылок без разбора по урлам ссылок, а как просто кучу текста. Но ведь он должен ссылочное ранжирование реализовывать как-то? И учитывать текст ссылок на сайты по урлам отдельно. Тогда
2.1) под-вариант: индекс для поиска по $anchor и индекс для учета сс.ранжирования – разные индексы. А нах надо хранить два разных? Это противоречит гипотезе “разработчики умны”. По идее, поиск по $anchor- извращение, ненужное обычному юзверю. Спецом его делать никто бы не стал.
2.2) под-вариант: индексы разделяются на индекс по текстам ссылок, где каждой ссылке, соответствует некий номер id, и индекс урлов ссылок по этим номерам. Тогда можно и ссылочное ражирование учесть, а в поиске по $anchor без #link – просто забить на второй индекс.

Видимо, это и есть разумный вариант. Хотя надо переобдумать завтра.

Ну или вот оно же- $anchor(вызов / 5 вызов) – 3-е место наш дорвей занимает. А слова “вызов” однозначно в разных ссылках стоят.
Хотя как-то странно все-таки работает этот поиск… Надо поковыряьтся.

Методы догадок

Где-то в классике я читал такой стори:

Типа в школах дети играли в камешки. Они зажимались в кулаке за спиной. Если противник угадывал, в какой руке камешек – он его забирал.
Одно дитё было известно как офигительный игрок, выигрывал буквально у всех.
Когда его спросили – как ты это делаешь – он сказал:

Я стараюсь представить себя на месте своего противника, и придаю своему лицу такое же выражение, как у него.
После этого я жду, какие мысли мне прийдут в голову.


То же может относиться и к “играм” оптимизаторов и поисковиков. Оптимизатору полезно заниматься разработкой алгоритмов поиска.
Как бы некую фичу реализовал я? Стал бы я ее вообще реализовывать?

Например. Считается, что нажатие на “улыбочки” в Гугль-баре ни на что не должно влиять. А стал бы ты делать механизм учета этих улыбочек, если бы они не влияли?
Еще. Считается, что тИЦ ни на что не влияет НАПРЯМУЮ. Понятно, что это есть индикатор, на который влияют: тематика, число ссылок на сайт, ВИЦ ссылающихся страниц, возможно, общее число ссылок на таких страницах (поделить типа).
А спрашивается – зачем рассчитывать столь геморройный параметр, только чтобы ранжировать сайты в Я-Каталоге? Практически все, что учитывается, является индикатором “качества” сайта – тогда почему бы его не использовать в ранжировании выдачи?

Длина учитываемого текста в title

Иногда раздаются возгласы, что мол, в тайтле учитываются только первые 50 символов или 7-8 слов. Ну, короче, мало. Причем авторитетно люди заявляют, со знанием дела…

Проверим:
1) Для начала найдем сайт с длинным тайтлом. Как его искать? Я сам навскидку не знаю… Попробуем с языком запросов, поиграемся расстоянием – ищем в тайтле часто употребляемые слова, с большим расстоянием между ними:

$title(сайт / 22 сайт)
-первый результат, http://www.vizavi.ru/cgi-bin/ank.cgi – уже не существует. Но ничего, возьмем кеш проиндексированной страницы. Тайтл там такой:

Агентство Визави Консалт Работа Поиск работы Агентство по подбору персонала поиск работы работы консалтинг деловые игры управленческое и кадровое консультирование консалтинг сопровождение и адаптация Job Get a job Need a job job agency Job agency сайт сервер web страница компьютерная сеть бесплатно javascript Click Trough Ratio ctr отклик cgi java java script photoshop Javascript сервер site сайт веб страничка ищу работу есть работа безработный специалист специальность

Несложно подсчитать. 474 символа, 65 слов
2) Ищем по последней фразе – безработный специалист специальность
Искомый сайт – на первом месте.

Вывод: бред сивой кобылы. Учитывается в тайтле гораздо больше.
___
По теме
http://www.searchengines.ru/forum/showthread.php?s=&threadid=3922

http://www.searchengines.ru/forum/showthread.php?s=&threadid=10374

http://www.searchengines.ru/forum/showthread.php?s=&threadid=5943

Чудеса у Рамблера

При запросе ноутбуки Рамблер перебрасывает на слово ноутбук. Причем в urlencoded-тексте запроса стоит уже “ноутбук”, “и” пропадает.

По другим запросам такого не вижу…
Может, рекламодатель по точному запросу рекламу проплатил? 🙂 Да вроде и рекламы-то не показывается по этому запросу…

Я попал в хорошую компанию…

Обнаружил новую ссылочку на себя – http://www.svabank.ru/links/

Центральный банк Российской Федерации (Банк России) www.cbr.ru
СКРИН (Система Комплексного Раскрытия Информации) www.skrin.ru
Министерство Российской Федерации по налогам и сборам www.nalog.ru
Министерство экономического развития и торговли Российской Федерации www.economy.gov.ru
Ассоциация Российских Банков (АРБ) www.arb.ru
Кредитный рейтинг www.sandp.ru
Банковский форум «Банкир» www.bankir.ru
Информационное агентство «Интерфакс» www.interfax.ru
Информационное агентство «РЕЙТЕР» www.reuters.ru
Стокпортал (портал фондового рынка) www.stockportal.ru
CBONDS www.сbonds.ru
РОСБИЗНЕСКОНСАЛТИНГ www.rbk.ru
Курсы валют cbrf.magazinfo.ru

-последний, http://cbrf.magazinfo.ru – мой.
Кстати, сайт с точки зрения дизайна – отстой полный,… надо переделать, блин… А сервис, видимо, нравится кому-то.
Забавный все-таки способ продвижения – на информерах со ссылкой. Разместил кто-то кнопочку – оппаньки, 4-ка ПР образовалась…

Кстати, реклама на этом сайте по валютам никому не нужна? 250 хостов в день.

Теперь погодные информеры сделаю. 🙂