Блоки ссылок и поиск по $anchor

Думал посмотреть, сколько слов с длинной ссылке играют роль. Кстати, наспамьте в камментах кто может: урлов сайтов, на которых есть длинные, очень длинные ссылки (внутренние или внешние, неважно).

Ну, думал, сейчас найду такие сайты с помощью чего-то типа $anchor(сайт / 10 сайт). И вижу первым:

создание сайтов
… сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web- …
www.kottedgi.ru/art_2.html (8 КБ) 20.04.2004 — совпадение фразы
Найденные слова · Похожие документы

Захожу на этот дорвейчик. Внизу видна гора ссылок:

создание сайтов cjplfybt cfqnjd компьютерная помощь ремонт компьютера ремонт компьютеров компьютеры ремонт ремонт компьютеров москва москва ремонт компьютеров ремонт пк ремонт компьютера в москве ремонт pc ремонт компьютеры ремонт компьютора ремонт компьютра ремонт кмпьютера ремонткомпьютера настройка компьютера настройка компьютеров установка windows установка windows 98 переустановка windows windows 98 установка windows98 настройка windows переустановка windows 98 виндовс установка windows xp операционные системы windows xp установка windowsxp установка ос установить windows переустановка windows xp установка программы локальная сеть установка драйвера настройка модемов создание сайта как создать сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web-дизайн веб-дизайн создание своего сайта создание web-сайтов создание web сайта создание веб сайта создание веб сайтов создание сайтв сздание сайтов созданиесайтов cjplfybt cfqnf htvjyn rjvgm.nthjd htvjyn rjvgm.nthf yfcnhjqrf rjvgm.nthjd yfcnhjqrf rjvgm.nthf cjplfybt cfqnf cfqn rjvgm.nth rjvgm.nths htvjyn cfqns цштвщцы ctnm ctnb vjltv vjltvs помощь компьютер скорая компьютерная помощь компьютерная скорая помощь компьютернаяпомощь вызов мастера по ремонту компьютера вызов мастера по настройке компьютера вызов мастера по установке windows вызов мастера по установке программ вызов мастера по настройке модема вызов мастера по созданию сайта

Причем все ссылки короткие, в пару слов. Как же Яндекс нашел эту страницу?
Поскольку для поиска по текстам ссылок необходимо иметь индекс по словам из текстов ссылок:
Варианта два.
1) Яндекс может объединять все стоящие рядом ссылки в одну – сначала меня проперло по этому варианту – хороший был бы способ борьбы с блоками ссылок… Но потом поостыл. Слишком экстремально. Хотя надо подумать.
2) Яндекс может хранить индекс по текстам ссылок без разбора по урлам ссылок, а как просто кучу текста. Но ведь он должен ссылочное ранжирование реализовывать как-то? И учитывать текст ссылок на сайты по урлам отдельно. Тогда
2.1) под-вариант: индекс для поиска по $anchor и индекс для учета сс.ранжирования – разные индексы. А нах надо хранить два разных? Это противоречит гипотезе “разработчики умны”. По идее, поиск по $anchor- извращение, ненужное обычному юзверю. Спецом его делать никто бы не стал.
2.2) под-вариант: индексы разделяются на индекс по текстам ссылок, где каждой ссылке, соответствует некий номер id, и индекс урлов ссылок по этим номерам. Тогда можно и ссылочное ражирование учесть, а в поиске по $anchor без #link – просто забить на второй индекс.

Видимо, это и есть разумный вариант. Хотя надо переобдумать завтра.

Ну или вот оно же- $anchor(вызов / 5 вызов) – 3-е место наш дорвей занимает. А слова “вызов” однозначно в разных ссылках стоят.
Хотя как-то странно все-таки работает этот поиск… Надо поковыряьтся.

Методы догадок

Где-то в классике я читал такой стори:

Типа в школах дети играли в камешки. Они зажимались в кулаке за спиной. Если противник угадывал, в какой руке камешек – он его забирал.
Одно дитё было известно как офигительный игрок, выигрывал буквально у всех.
Когда его спросили – как ты это делаешь – он сказал:

Я стараюсь представить себя на месте своего противника, и придаю своему лицу такое же выражение, как у него.
После этого я жду, какие мысли мне прийдут в голову.


То же может относиться и к “играм” оптимизаторов и поисковиков. Оптимизатору полезно заниматься разработкой алгоритмов поиска.
Как бы некую фичу реализовал я? Стал бы я ее вообще реализовывать?

Например. Считается, что нажатие на “улыбочки” в Гугль-баре ни на что не должно влиять. А стал бы ты делать механизм учета этих улыбочек, если бы они не влияли?
Еще. Считается, что тИЦ ни на что не влияет НАПРЯМУЮ. Понятно, что это есть индикатор, на который влияют: тематика, число ссылок на сайт, ВИЦ ссылающихся страниц, возможно, общее число ссылок на таких страницах (поделить типа).
А спрашивается – зачем рассчитывать столь геморройный параметр, только чтобы ранжировать сайты в Я-Каталоге? Практически все, что учитывается, является индикатором “качества” сайта – тогда почему бы его не использовать в ранжировании выдачи?

Длина учитываемого текста в title

Иногда раздаются возгласы, что мол, в тайтле учитываются только первые 50 символов или 7-8 слов. Ну, короче, мало. Причем авторитетно люди заявляют, со знанием дела…

Проверим:
1) Для начала найдем сайт с длинным тайтлом. Как его искать? Я сам навскидку не знаю… Попробуем с языком запросов, поиграемся расстоянием – ищем в тайтле часто употребляемые слова, с большим расстоянием между ними:

$title(сайт / 22 сайт)
-первый результат, http://www.vizavi.ru/cgi-bin/ank.cgi – уже не существует. Но ничего, возьмем кеш проиндексированной страницы. Тайтл там такой:

Агентство Визави Консалт Работа Поиск работы Агентство по подбору персонала поиск работы работы консалтинг деловые игры управленческое и кадровое консультирование консалтинг сопровождение и адаптация Job Get a job Need a job job agency Job agency сайт сервер web страница компьютерная сеть бесплатно javascript Click Trough Ratio ctr отклик cgi java java script photoshop Javascript сервер site сайт веб страничка ищу работу есть работа безработный специалист специальность

Несложно подсчитать. 474 символа, 65 слов
2) Ищем по последней фразе – безработный специалист специальность
Искомый сайт – на первом месте.

Вывод: бред сивой кобылы. Учитывается в тайтле гораздо больше.
___
По теме
http://www.searchengines.ru/forum/showthread.php?s=&threadid=3922

http://www.searchengines.ru/forum/showthread.php?s=&threadid=10374

http://www.searchengines.ru/forum/showthread.php?s=&threadid=5943

Чудеса у Рамблера

При запросе ноутбуки Рамблер перебрасывает на слово ноутбук. Причем в urlencoded-тексте запроса стоит уже “ноутбук”, “и” пропадает.

По другим запросам такого не вижу…
Может, рекламодатель по точному запросу рекламу проплатил? 🙂 Да вроде и рекламы-то не показывается по этому запросу…

Я попал в хорошую компанию…

Обнаружил новую ссылочку на себя – http://www.svabank.ru/links/

Центральный банк Российской Федерации (Банк России) www.cbr.ru
СКРИН (Система Комплексного Раскрытия Информации) www.skrin.ru
Министерство Российской Федерации по налогам и сборам www.nalog.ru
Министерство экономического развития и торговли Российской Федерации www.economy.gov.ru
Ассоциация Российских Банков (АРБ) www.arb.ru
Кредитный рейтинг www.sandp.ru
Банковский форум «Банкир» www.bankir.ru
Информационное агентство «Интерфакс» www.interfax.ru
Информационное агентство «РЕЙТЕР» www.reuters.ru
Стокпортал (портал фондового рынка) www.stockportal.ru
CBONDS www.сbonds.ru
РОСБИЗНЕСКОНСАЛТИНГ www.rbk.ru
Курсы валют cbrf.magazinfo.ru

-последний, http://cbrf.magazinfo.ru – мой.
Кстати, сайт с точки зрения дизайна – отстой полный,… надо переделать, блин… А сервис, видимо, нравится кому-то.
Забавный все-таки способ продвижения – на информерах со ссылкой. Разместил кто-то кнопочку – оппаньки, 4-ка ПР образовалась…

Кстати, реклама на этом сайте по валютам никому не нужна? 250 хостов в день.

Теперь погодные информеры сделаю. 🙂

Mail.ru хочет заявить о себе…

По следам новости Mail.ru запускает поиск по письмам:

говорит Дмитрий Гришин, генеральный директор компании Mail.ru.
– Для нас также крайне важно еще раз заявить о себе, как о серьезном разработчике на рынке поисковых технологий

Если же пользователь не знает, как правильно пишется интересующее его слово, то он имеет возможность использовать стандартные символы “*” (заменяет последовательность любых символов произвольной длины) и “?” (заменяет один произвольный символ).

Это значит, Мейлру хочет заявить о себе, но для завки использует тупой поиск вида LIKE, RLIKE в базах? (Вот как у меня в верхнем углу).

Все равно никто не поймет… Пипл схавает…

Версии страниц в Рамблере

Столкнулся с интересной штукой. Рамблер в выдаче показывает 6 страниц сайта, когда их всего 3.
А при просмотре “еще с сайта” видно, что он хранит предыдущие версии страниц, по крайней мере тайтлы у старых версий старые. И даты на неделю раньше “новых” дат.

К вопросу о 2000

Задаем в Яндекс запрос 2000. Ну, на первом месте – понятно кто, Ашманов со товарищи. В название сайта входит “2000”.
А вот на втором-

Ошибка 404
Windows 2000
Подготовка к переходу на Windows 2000
www.microsoft.com/RUS/Products/OS/win95/win95.htm (28 КБ) 03.12.2003 — строгое соответствие
Найденные слова · Похожие документы · Еще с сайта (1922) · Рубрика: Windows

.. да, хорошо у Гейтса прошел переход на 2000-ю… Качественно 🙂

Жигули – это пиво или автомобиль?

Продолжаем тему. Запрос жигули. Ну, на первом месте самизнаетекто. А 4 место-

Обратимся к “классике”
текст ссылок: Корифеи тюнинга почти забыли о жигулях…
www2.zr.ru/magzr/geta.asp?zr=200009058 (612 байт) — найден по ссылке
Похожие документы · Еще с сайта (1721) · Рубрика: Автомобили

Страница-то внутренняя. Найдена по ссылке. Запрос, предположительно, неплохой – если любителей пива исключить.

С какой радости “по ссылке найдено”- понятно: это фрейм, в котором ничего целевого не написано.

Кто ссылается такими словами вообще?
$anchor(Корифеи тюнинга почти забыли о жигулях) – только один сайт, ссылка со страницы http://www.585.ru/auto/dopoborud.htm. Страница, каких немеряно.

Ссылка куда надо (кстати, на самом zr.ru внутренние ссылки просто дубовые – “предыдущая и следующая страница”) – Корифеи тюнинга почти забыли о “жигулях”. К счастью, встречаются еще “оазисы”, где для них предлагают недорогие доработки.

И что у нас по отдельным запросам получается: пресловутая http://www2.zr.ru/magzr/geta.asp?zr=200009058 находится в Яндексе по запросам:

корифей – 2
тюнинг – нет в 30
счастье – нет в 30
..по другим однословным запросам сайта нет. Но в общем-то, многие из них конкурентны. Видимо, более конкурентны, чем надо.

Что-то в последнее время замечаю слишком много найденных по ссылке в Яндекcе результатов…

_______позднее дополнение:

Да, что-то я рановато радовался… Все ссылки с этой страницы играют неплохую роль!

Например, с http://www.585.ru/auto/dopoborud.htm
есть ссылка “Огнетушители”, по которой страница http://www2.zr.ru/zrmagazine/zr0797/76-78.htm находится 6-й в Яндексе. Правда, уже не по ссылке, там есть нужный текст.

То же со ссылкой “Багажник на крыше” на http://www2.zr.ru/zrmagazine/zr0501/88-89.htm – эта страница 1-я по “Багажник на крыше”, 2-я по “Багажник” (!!! 3-я по “багажник”), 13-я по “крыше”.

Ссылка на http://www2.zr.ru/magzr/geta.asp?zr=199905028 со словами
Как правильно выбрать прицеп и о чем нужно знать, эксплуатируя автопоезд дает: 12-е место по “прицеп”у, 23-е по “автопоезд”у, 1-е по “выбрать прицеп”,

… а по запросу “выбрать” видим на 2 месте пресловутую

АВТОГАРАНТ-ЛАДА. Новости
текст ссылок: выбрать автомобиль…

Следующая ссылка на http://www2.zr.ru/zrmagazine/zr0601/156-157.html
(“Треугольник или ведро? Знак аварийной остановки неспособен предупредить об опасности”) дает этой странице: 3-е место по “Треугольник”у (!! но 11-е по “треугольник”у), 3-е место по “ведро”!!!

… может, действительно, просто некие специальные страницы рулят, а не длинные ссылки? Те-то ссылки были и короткие тоже…