Блоки ссылок и поиск по $anchor

Думал посмотреть, сколько слов с длинной ссылке играют роль. Кстати, наспамьте в камментах кто может: урлов сайтов, на которых есть длинные, очень длинные ссылки (внутренние или внешние, неважно).

Ну, думал, сейчас найду такие сайты с помощью чего-то типа $anchor(сайт / 10 сайт). И вижу первым:

создание сайтов
… сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web- …
www.kottedgi.ru/art_2.html (8 КБ) 20.04.2004 — совпадение фразы
Найденные слова · Похожие документы

Захожу на этот дорвейчик. Внизу видна гора ссылок:

создание сайтов cjplfybt cfqnjd компьютерная помощь ремонт компьютера ремонт компьютеров компьютеры ремонт ремонт компьютеров москва москва ремонт компьютеров ремонт пк ремонт компьютера в москве ремонт pc ремонт компьютеры ремонт компьютора ремонт компьютра ремонт кмпьютера ремонткомпьютера настройка компьютера настройка компьютеров установка windows установка windows 98 переустановка windows windows 98 установка windows98 настройка windows переустановка windows 98 виндовс установка windows xp операционные системы windows xp установка windowsxp установка ос установить windows переустановка windows xp установка программы локальная сеть установка драйвера настройка модемов создание сайта как создать сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web-дизайн веб-дизайн создание своего сайта создание web-сайтов создание web сайта создание веб сайта создание веб сайтов создание сайтв сздание сайтов созданиесайтов cjplfybt cfqnf htvjyn rjvgm.nthjd htvjyn rjvgm.nthf yfcnhjqrf rjvgm.nthjd yfcnhjqrf rjvgm.nthf cjplfybt cfqnf cfqn rjvgm.nth rjvgm.nths htvjyn cfqns цштвщцы ctnm ctnb vjltv vjltvs помощь компьютер скорая компьютерная помощь компьютерная скорая помощь компьютернаяпомощь вызов мастера по ремонту компьютера вызов мастера по настройке компьютера вызов мастера по установке windows вызов мастера по установке программ вызов мастера по настройке модема вызов мастера по созданию сайта

Причем все ссылки короткие, в пару слов. Как же Яндекс нашел эту страницу?
Поскольку для поиска по текстам ссылок необходимо иметь индекс по словам из текстов ссылок:
Варианта два.
1) Яндекс может объединять все стоящие рядом ссылки в одну – сначала меня проперло по этому варианту – хороший был бы способ борьбы с блоками ссылок… Но потом поостыл. Слишком экстремально. Хотя надо подумать.
2) Яндекс может хранить индекс по текстам ссылок без разбора по урлам ссылок, а как просто кучу текста. Но ведь он должен ссылочное ранжирование реализовывать как-то? И учитывать текст ссылок на сайты по урлам отдельно. Тогда
2.1) под-вариант: индекс для поиска по $anchor и индекс для учета сс.ранжирования – разные индексы. А нах надо хранить два разных? Это противоречит гипотезе “разработчики умны”. По идее, поиск по $anchor- извращение, ненужное обычному юзверю. Спецом его делать никто бы не стал.
2.2) под-вариант: индексы разделяются на индекс по текстам ссылок, где каждой ссылке, соответствует некий номер id, и индекс урлов ссылок по этим номерам. Тогда можно и ссылочное ражирование учесть, а в поиске по $anchor без #link – просто забить на второй индекс.

Видимо, это и есть разумный вариант. Хотя надо переобдумать завтра.

Ну или вот оно же- $anchor(вызов / 5 вызов) – 3-е место наш дорвей занимает. А слова “вызов” однозначно в разных ссылках стоят.
Хотя как-то странно все-таки работает этот поиск… Надо поковыряьтся.

Методы догадок

Где-то в классике я читал такой стори:

Типа в школах дети играли в камешки. Они зажимались в кулаке за спиной. Если противник угадывал, в какой руке камешек – он его забирал.
Одно дитё было известно как офигительный игрок, выигрывал буквально у всех.
Когда его спросили – как ты это делаешь – он сказал:

Я стараюсь представить себя на месте своего противника, и придаю своему лицу такое же выражение, как у него.
После этого я жду, какие мысли мне прийдут в голову.


То же может относиться и к “играм” оптимизаторов и поисковиков. Оптимизатору полезно заниматься разработкой алгоритмов поиска.
Как бы некую фичу реализовал я? Стал бы я ее вообще реализовывать?

Например. Считается, что нажатие на “улыбочки” в Гугль-баре ни на что не должно влиять. А стал бы ты делать механизм учета этих улыбочек, если бы они не влияли?
Еще. Считается, что тИЦ ни на что не влияет НАПРЯМУЮ. Понятно, что это есть индикатор, на который влияют: тематика, число ссылок на сайт, ВИЦ ссылающихся страниц, возможно, общее число ссылок на таких страницах (поделить типа).
А спрашивается – зачем рассчитывать столь геморройный параметр, только чтобы ранжировать сайты в Я-Каталоге? Практически все, что учитывается, является индикатором “качества” сайта – тогда почему бы его не использовать в ранжировании выдачи?