Беспечные люди – банкиры…

Обнаружил у себя в рассылке http://links.obgon.ru/expired.php?2004-07-21 свободный домен с тИЦом 350: devon-credit.ru. Да, это зеркало devoncredit.ru, т.е. покупать нет смысла вроде бы.

Только на это зеркало ведут 57 ссылок из суммарных 78.
Т.е., на основной домен указывает треть всех ссылок, а основная масса-на брошенный. А татарским банкирам-то по фигу.

работники х… и п…

По работным запросам наткнулся на кучку дорвеев: от http://1.crutop.ru/ до http://8.crutop.ru/ . Характерно – до ста страниц на домене.
Интересно, кто надоумил?

А кеш Яндекса – то другой, не такой простой!

Оплата – 0.9 цента работа для молодежи в уфе за показ, для каждой из программ или 0.54$ в час (это работа для молодежи в уфе 54 points ). работа для молодежи в уфе Самый простой этап – это получение чека. Когда на вашем работа для молодежи в уфе счету накопится сумма равная или больше минимальной вам вышлют чек, некоторые работа для молодежи в уфе спонсоры уведомляют об этом письмом по E-Mail

для 7.crutop.ru/rabota_dla_molodezi_w_ufe.html

Блоки ссылок и поиск по $anchor

Думал посмотреть, сколько слов с длинной ссылке играют роль. Кстати, наспамьте в камментах кто может: урлов сайтов, на которых есть длинные, очень длинные ссылки (внутренние или внешние, неважно).

Ну, думал, сейчас найду такие сайты с помощью чего-то типа $anchor(сайт / 10 сайт). И вижу первым:

создание сайтов
… сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web- …
www.kottedgi.ru/art_2.html (8 КБ) 20.04.2004 — совпадение фразы
Найденные слова · Похожие документы

Захожу на этот дорвейчик. Внизу видна гора ссылок:

создание сайтов cjplfybt cfqnjd компьютерная помощь ремонт компьютера ремонт компьютеров компьютеры ремонт ремонт компьютеров москва москва ремонт компьютеров ремонт пк ремонт компьютера в москве ремонт pc ремонт компьютеры ремонт компьютора ремонт компьютра ремонт кмпьютера ремонткомпьютера настройка компьютера настройка компьютеров установка windows установка windows 98 переустановка windows windows 98 установка windows98 настройка windows переустановка windows 98 виндовс установка windows xp операционные системы windows xp установка windowsxp установка ос установить windows переустановка windows xp установка программы локальная сеть установка драйвера настройка модемов создание сайта как создать сайт разработка сайта раскрутка сайта веб дизайн разработка сайтов дизайн сайтов создать сайт дизайн сайта изготовление сайтов изготовление сайта web-дизайн веб-дизайн создание своего сайта создание web-сайтов создание web сайта создание веб сайта создание веб сайтов создание сайтв сздание сайтов созданиесайтов cjplfybt cfqnf htvjyn rjvgm.nthjd htvjyn rjvgm.nthf yfcnhjqrf rjvgm.nthjd yfcnhjqrf rjvgm.nthf cjplfybt cfqnf cfqn rjvgm.nth rjvgm.nths htvjyn cfqns цштвщцы ctnm ctnb vjltv vjltvs помощь компьютер скорая компьютерная помощь компьютерная скорая помощь компьютернаяпомощь вызов мастера по ремонту компьютера вызов мастера по настройке компьютера вызов мастера по установке windows вызов мастера по установке программ вызов мастера по настройке модема вызов мастера по созданию сайта

Причем все ссылки короткие, в пару слов. Как же Яндекс нашел эту страницу?
Поскольку для поиска по текстам ссылок необходимо иметь индекс по словам из текстов ссылок:
Варианта два.
1) Яндекс может объединять все стоящие рядом ссылки в одну – сначала меня проперло по этому варианту – хороший был бы способ борьбы с блоками ссылок… Но потом поостыл. Слишком экстремально. Хотя надо подумать.
2) Яндекс может хранить индекс по текстам ссылок без разбора по урлам ссылок, а как просто кучу текста. Но ведь он должен ссылочное ранжирование реализовывать как-то? И учитывать текст ссылок на сайты по урлам отдельно. Тогда
2.1) под-вариант: индекс для поиска по $anchor и индекс для учета сс.ранжирования – разные индексы. А нах надо хранить два разных? Это противоречит гипотезе “разработчики умны”. По идее, поиск по $anchor- извращение, ненужное обычному юзверю. Спецом его делать никто бы не стал.
2.2) под-вариант: индексы разделяются на индекс по текстам ссылок, где каждой ссылке, соответствует некий номер id, и индекс урлов ссылок по этим номерам. Тогда можно и ссылочное ражирование учесть, а в поиске по $anchor без #link – просто забить на второй индекс.

Видимо, это и есть разумный вариант. Хотя надо переобдумать завтра.

Ну или вот оно же- $anchor(вызов / 5 вызов) – 3-е место наш дорвей занимает. А слова “вызов” однозначно в разных ссылках стоят.
Хотя как-то странно все-таки работает этот поиск… Надо поковыряьтся.

Методы догадок

Где-то в классике я читал такой стори:

Типа в школах дети играли в камешки. Они зажимались в кулаке за спиной. Если противник угадывал, в какой руке камешек – он его забирал.
Одно дитё было известно как офигительный игрок, выигрывал буквально у всех.
Когда его спросили – как ты это делаешь – он сказал:

Я стараюсь представить себя на месте своего противника, и придаю своему лицу такое же выражение, как у него.
После этого я жду, какие мысли мне прийдут в голову.


То же может относиться и к “играм” оптимизаторов и поисковиков. Оптимизатору полезно заниматься разработкой алгоритмов поиска.
Как бы некую фичу реализовал я? Стал бы я ее вообще реализовывать?

Например. Считается, что нажатие на “улыбочки” в Гугль-баре ни на что не должно влиять. А стал бы ты делать механизм учета этих улыбочек, если бы они не влияли?
Еще. Считается, что тИЦ ни на что не влияет НАПРЯМУЮ. Понятно, что это есть индикатор, на который влияют: тематика, число ссылок на сайт, ВИЦ ссылающихся страниц, возможно, общее число ссылок на таких страницах (поделить типа).
А спрашивается – зачем рассчитывать столь геморройный параметр, только чтобы ранжировать сайты в Я-Каталоге? Практически все, что учитывается, является индикатором “качества” сайта – тогда почему бы его не использовать в ранжировании выдачи?

Длина учитываемого текста в title

Иногда раздаются возгласы, что мол, в тайтле учитываются только первые 50 символов или 7-8 слов. Ну, короче, мало. Причем авторитетно люди заявляют, со знанием дела…

Проверим:
1) Для начала найдем сайт с длинным тайтлом. Как его искать? Я сам навскидку не знаю… Попробуем с языком запросов, поиграемся расстоянием – ищем в тайтле часто употребляемые слова, с большим расстоянием между ними:

$title(сайт / 22 сайт)
-первый результат, http://www.vizavi.ru/cgi-bin/ank.cgi – уже не существует. Но ничего, возьмем кеш проиндексированной страницы. Тайтл там такой:

Агентство Визави Консалт Работа Поиск работы Агентство по подбору персонала поиск работы работы консалтинг деловые игры управленческое и кадровое консультирование консалтинг сопровождение и адаптация Job Get a job Need a job job agency Job agency сайт сервер web страница компьютерная сеть бесплатно javascript Click Trough Ratio ctr отклик cgi java java script photoshop Javascript сервер site сайт веб страничка ищу работу есть работа безработный специалист специальность

Несложно подсчитать. 474 символа, 65 слов
2) Ищем по последней фразе – безработный специалист специальность
Искомый сайт – на первом месте.

Вывод: бред сивой кобылы. Учитывается в тайтле гораздо больше.
___
По теме
http://www.searchengines.ru/forum/showthread.php?s=&threadid=3922

http://www.searchengines.ru/forum/showthread.php?s=&threadid=10374

http://www.searchengines.ru/forum/showthread.php?s=&threadid=5943

Чудеса у Рамблера

При запросе ноутбуки Рамблер перебрасывает на слово ноутбук. Причем в urlencoded-тексте запроса стоит уже “ноутбук”, “и” пропадает.

По другим запросам такого не вижу…
Может, рекламодатель по точному запросу рекламу проплатил? 🙂 Да вроде и рекламы-то не показывается по этому запросу…

Я попал в хорошую компанию…

Обнаружил новую ссылочку на себя – http://www.svabank.ru/links/

Центральный банк Российской Федерации (Банк России) www.cbr.ru
СКРИН (Система Комплексного Раскрытия Информации) www.skrin.ru
Министерство Российской Федерации по налогам и сборам www.nalog.ru
Министерство экономического развития и торговли Российской Федерации www.economy.gov.ru
Ассоциация Российских Банков (АРБ) www.arb.ru
Кредитный рейтинг www.sandp.ru
Банковский форум «Банкир» www.bankir.ru
Информационное агентство «Интерфакс» www.interfax.ru
Информационное агентство «РЕЙТЕР» www.reuters.ru
Стокпортал (портал фондового рынка) www.stockportal.ru
CBONDS www.сbonds.ru
РОСБИЗНЕСКОНСАЛТИНГ www.rbk.ru
Курсы валют cbrf.magazinfo.ru

-последний, http://cbrf.magazinfo.ru – мой.
Кстати, сайт с точки зрения дизайна – отстой полный,… надо переделать, блин… А сервис, видимо, нравится кому-то.
Забавный все-таки способ продвижения – на информерах со ссылкой. Разместил кто-то кнопочку – оппаньки, 4-ка ПР образовалась…

Кстати, реклама на этом сайте по валютам никому не нужна? 250 хостов в день.

Теперь погодные информеры сделаю. 🙂

Mail.ru хочет заявить о себе…

По следам новости Mail.ru запускает поиск по письмам:

говорит Дмитрий Гришин, генеральный директор компании Mail.ru.
– Для нас также крайне важно еще раз заявить о себе, как о серьезном разработчике на рынке поисковых технологий

Если же пользователь не знает, как правильно пишется интересующее его слово, то он имеет возможность использовать стандартные символы “*” (заменяет последовательность любых символов произвольной длины) и “?” (заменяет один произвольный символ).

Это значит, Мейлру хочет заявить о себе, но для завки использует тупой поиск вида LIKE, RLIKE в базах? (Вот как у меня в верхнем углу).

Все равно никто не поймет… Пипл схавает…

Версии страниц в Рамблере

Столкнулся с интересной штукой. Рамблер в выдаче показывает 6 страниц сайта, когда их всего 3.
А при просмотре “еще с сайта” видно, что он хранит предыдущие версии страниц, по крайней мере тайтлы у старых версий старые. И даты на неделю раньше “новых” дат.