Методы догадок

Где-то в классике я читал такой стори:

Типа в школах дети играли в камешки. Они зажимались в кулаке за спиной. Если противник угадывал, в какой руке камешек – он его забирал.
Одно дитё было известно как офигительный игрок, выигрывал буквально у всех.
Когда его спросили – как ты это делаешь – он сказал:

Я стараюсь представить себя на месте своего противника, и придаю своему лицу такое же выражение, как у него.
После этого я жду, какие мысли мне прийдут в голову.


То же может относиться и к “играм” оптимизаторов и поисковиков. Оптимизатору полезно заниматься разработкой алгоритмов поиска.
Как бы некую фичу реализовал я? Стал бы я ее вообще реализовывать?

Например. Считается, что нажатие на “улыбочки” в Гугль-баре ни на что не должно влиять. А стал бы ты делать механизм учета этих улыбочек, если бы они не влияли?
Еще. Считается, что тИЦ ни на что не влияет НАПРЯМУЮ. Понятно, что это есть индикатор, на который влияют: тематика, число ссылок на сайт, ВИЦ ссылающихся страниц, возможно, общее число ссылок на таких страницах (поделить типа).
А спрашивается – зачем рассчитывать столь геморройный параметр, только чтобы ранжировать сайты в Я-Каталоге? Практически все, что учитывается, является индикатором “качества” сайта – тогда почему бы его не использовать в ранжировании выдачи?

Длина учитываемого текста в title

Иногда раздаются возгласы, что мол, в тайтле учитываются только первые 50 символов или 7-8 слов. Ну, короче, мало. Причем авторитетно люди заявляют, со знанием дела…

Проверим:
1) Для начала найдем сайт с длинным тайтлом. Как его искать? Я сам навскидку не знаю… Попробуем с языком запросов, поиграемся расстоянием – ищем в тайтле часто употребляемые слова, с большим расстоянием между ними:

$title(сайт / 22 сайт)
-первый результат, http://www.vizavi.ru/cgi-bin/ank.cgi – уже не существует. Но ничего, возьмем кеш проиндексированной страницы. Тайтл там такой:

Агентство Визави Консалт Работа Поиск работы Агентство по подбору персонала поиск работы работы консалтинг деловые игры управленческое и кадровое консультирование консалтинг сопровождение и адаптация Job Get a job Need a job job agency Job agency сайт сервер web страница компьютерная сеть бесплатно javascript Click Trough Ratio ctr отклик cgi java java script photoshop Javascript сервер site сайт веб страничка ищу работу есть работа безработный специалист специальность

Несложно подсчитать. 474 символа, 65 слов
2) Ищем по последней фразе – безработный специалист специальность
Искомый сайт – на первом месте.

Вывод: бред сивой кобылы. Учитывается в тайтле гораздо больше.
___
По теме
http://www.searchengines.ru/forum/showthread.php?s=&threadid=3922

http://www.searchengines.ru/forum/showthread.php?s=&threadid=10374

http://www.searchengines.ru/forum/showthread.php?s=&threadid=5943

Чудеса у Рамблера

При запросе ноутбуки Рамблер перебрасывает на слово ноутбук. Причем в urlencoded-тексте запроса стоит уже “ноутбук”, “и” пропадает.

По другим запросам такого не вижу…
Может, рекламодатель по точному запросу рекламу проплатил? 🙂 Да вроде и рекламы-то не показывается по этому запросу…

Я попал в хорошую компанию…

Обнаружил новую ссылочку на себя – http://www.svabank.ru/links/

Центральный банк Российской Федерации (Банк России) www.cbr.ru
СКРИН (Система Комплексного Раскрытия Информации) www.skrin.ru
Министерство Российской Федерации по налогам и сборам www.nalog.ru
Министерство экономического развития и торговли Российской Федерации www.economy.gov.ru
Ассоциация Российских Банков (АРБ) www.arb.ru
Кредитный рейтинг www.sandp.ru
Банковский форум «Банкир» www.bankir.ru
Информационное агентство «Интерфакс» www.interfax.ru
Информационное агентство «РЕЙТЕР» www.reuters.ru
Стокпортал (портал фондового рынка) www.stockportal.ru
CBONDS www.сbonds.ru
РОСБИЗНЕСКОНСАЛТИНГ www.rbk.ru
Курсы валют cbrf.magazinfo.ru

-последний, http://cbrf.magazinfo.ru – мой.
Кстати, сайт с точки зрения дизайна – отстой полный,… надо переделать, блин… А сервис, видимо, нравится кому-то.
Забавный все-таки способ продвижения – на информерах со ссылкой. Разместил кто-то кнопочку – оппаньки, 4-ка ПР образовалась…

Кстати, реклама на этом сайте по валютам никому не нужна? 250 хостов в день.

Теперь погодные информеры сделаю. 🙂

Mail.ru хочет заявить о себе…

По следам новости Mail.ru запускает поиск по письмам:

говорит Дмитрий Гришин, генеральный директор компании Mail.ru.
– Для нас также крайне важно еще раз заявить о себе, как о серьезном разработчике на рынке поисковых технологий

Если же пользователь не знает, как правильно пишется интересующее его слово, то он имеет возможность использовать стандартные символы “*” (заменяет последовательность любых символов произвольной длины) и “?” (заменяет один произвольный символ).

Это значит, Мейлру хочет заявить о себе, но для завки использует тупой поиск вида LIKE, RLIKE в базах? (Вот как у меня в верхнем углу).

Все равно никто не поймет… Пипл схавает…

Версии страниц в Рамблере

Столкнулся с интересной штукой. Рамблер в выдаче показывает 6 страниц сайта, когда их всего 3.
А при просмотре “еще с сайта” видно, что он хранит предыдущие версии страниц, по крайней мере тайтлы у старых версий старые. И даты на неделю раньше “новых” дат.

К вопросу о 2000

Задаем в Яндекс запрос 2000. Ну, на первом месте – понятно кто, Ашманов со товарищи. В название сайта входит “2000”.
А вот на втором-

Ошибка 404
Windows 2000
Подготовка к переходу на Windows 2000
www.microsoft.com/RUS/Products/OS/win95/win95.htm (28 КБ) 03.12.2003 — строгое соответствие
Найденные слова · Похожие документы · Еще с сайта (1922) · Рубрика: Windows

.. да, хорошо у Гейтса прошел переход на 2000-ю… Качественно 🙂

Жигули – это пиво или автомобиль?

Продолжаем тему. Запрос жигули. Ну, на первом месте самизнаетекто. А 4 место-

Обратимся к “классике”
текст ссылок: Корифеи тюнинга почти забыли о жигулях…
www2.zr.ru/magzr/geta.asp?zr=200009058 (612 байт) — найден по ссылке
Похожие документы · Еще с сайта (1721) · Рубрика: Автомобили

Страница-то внутренняя. Найдена по ссылке. Запрос, предположительно, неплохой – если любителей пива исключить.

С какой радости “по ссылке найдено”- понятно: это фрейм, в котором ничего целевого не написано.

Кто ссылается такими словами вообще?
$anchor(Корифеи тюнинга почти забыли о жигулях) – только один сайт, ссылка со страницы http://www.585.ru/auto/dopoborud.htm. Страница, каких немеряно.

Ссылка куда надо (кстати, на самом zr.ru внутренние ссылки просто дубовые – “предыдущая и следующая страница”) – Корифеи тюнинга почти забыли о “жигулях”. К счастью, встречаются еще “оазисы”, где для них предлагают недорогие доработки.

И что у нас по отдельным запросам получается: пресловутая http://www2.zr.ru/magzr/geta.asp?zr=200009058 находится в Яндексе по запросам:

корифей – 2
тюнинг – нет в 30
счастье – нет в 30
..по другим однословным запросам сайта нет. Но в общем-то, многие из них конкурентны. Видимо, более конкурентны, чем надо.

Что-то в последнее время замечаю слишком много найденных по ссылке в Яндекcе результатов…

_______позднее дополнение:

Да, что-то я рановато радовался… Все ссылки с этой страницы играют неплохую роль!

Например, с http://www.585.ru/auto/dopoborud.htm
есть ссылка “Огнетушители”, по которой страница http://www2.zr.ru/zrmagazine/zr0797/76-78.htm находится 6-й в Яндексе. Правда, уже не по ссылке, там есть нужный текст.

То же со ссылкой “Багажник на крыше” на http://www2.zr.ru/zrmagazine/zr0501/88-89.htm – эта страница 1-я по “Багажник на крыше”, 2-я по “Багажник” (!!! 3-я по “багажник”), 13-я по “крыше”.

Ссылка на http://www2.zr.ru/magzr/geta.asp?zr=199905028 со словами
Как правильно выбрать прицеп и о чем нужно знать, эксплуатируя автопоезд дает: 12-е место по “прицеп”у, 23-е по “автопоезд”у, 1-е по “выбрать прицеп”,

… а по запросу “выбрать” видим на 2 месте пресловутую

АВТОГАРАНТ-ЛАДА. Новости
текст ссылок: выбрать автомобиль…

Следующая ссылка на http://www2.zr.ru/zrmagazine/zr0601/156-157.html
(“Треугольник или ведро? Знак аварийной остановки неспособен предупредить об опасности”) дает этой странице: 3-е место по “Треугольник”у (!! но 11-е по “треугольник”у), 3-е место по “ведро”!!!

… может, действительно, просто некие специальные страницы рулят, а не длинные ссылки? Те-то ссылки были и короткие тоже…

Автомобили

Еще примерчик, правда, не совсем про длинные ссылки. Про позиции нахаляву, скорее.

Запрос автомобиль в Яндексе. Третье место-

АВТОГАРАНТ-ЛАДА. Новости
текст ссылок: выбрать автомобиль… вы уезжаете на новеньком автомобиле…
www.agl.ru/feedback/ (4 КБ) — найден по ссылке
Похожие документы · Еще с сайта (3)

Страница без контента абсолютно. А “Найденные слова” не показываются.

Кто на нее персонально ссылается – понятно – основной сайт, но по словам “обратная связь”, которые на фиг не при чем.

А кто же на эту страницу ссылается? Поищем по тексту сниппетов-ссылок-
$anchor(вы уезжаете на новеньком автомобиле)

Ссылка есть на http://www.tltinfo.ru/index.php?id=2635, даже две.
Вторая, “вы уезжаете на новеньком автомобиле!” – ведет на несуществующую http://www.agl.ru/choose_new_auto/, которая отдает 200 ОК.

Может быть, ссылки на все такие “несуществующие” страницы слеплены? И когда был сбой со страницей фидбэка, ее прилепили туда же?

Но всего одна-две ссылки… да и на основной сайт-то их мало – тИЦ=50…

А, блин. Так у этого сайта индексная страница вывалилась- serverurl=www.agl.ru. Может, действительно, ссылочное ранжирование на морду сайта наследуется внутренними?