Интересный эффект: подстановка ссылок в тайтл

Где-то я это уже видел в Яндексе, но потом основательно подзабыл…
Прикольный эффект – если тайтл у страницы пустой, Яндекс в тайтл поставляет текст ссылки.
1) Простор для того, чтобы кого-нибудь забывшего тайтлы прописать, сильно обидеть, понаставив достаточно нужных ссылок… 🙂 Причем обидеть от его собственного лица. Ведь юзер воспринимает текст ссылки в выдаче как родной тайтл сайта
2) Простор для того, чтобы делать контекстно-зависимые тайтлы в Яндексе. Типа, юзер набрал один запрос – ему один тайтл. Набрал другой – на тебе другой! И никакого мошенничества 🙂
Я как увидел такое, начало башню потихоньку срывать… Потом вспомнил про ссылки. Но я не думал, что Яндекс может разные тайтлы делать, думал, он обязательно сотворит попурри из ссылок и будет это как одинаковый для разных запросов тайтл использовать… Раньше он как раз такую мешанину выдавал… Но хотя бы было понятно, что это не родной текст.

Примеры:
ссылка на aliance3plus.ru обязательная (1-й)
ссылка на aliance3plus.ru (1-й)
aliance3plus.ru (2-й)
#url=”www.aliance3plus.ru” – настоящее положение дел 🙂

И ведь оно не пишет, что “найден по ссылке”! Вот это нехорошо.

PS Еще для сравнения:
полезные ссылки #url=”www.aliance3plus.ru”, полезные #url=”www.aliance3plus.ru”, полезные && #url=”www.aliance3plus.ru”, альянс && #url=”www.aliance3plus.ru”

sweb.ru – докатились…

Я давно знал, что хостинг spaceweb ( www.sweb.ru ) покупает брошенные домены и зеркалит их на себя: http://blog.promosite.ru/comments.php?199 и http://blog.promosite.ru/comments.php?92

Но теперь уже совсем обнаглели…

Захостил я у них домен, а выкладывать то ли ничего не стал, то ли выложил заглушку. Типа пусто. А вот недавно новое содержимое выложил на хостинг, нс-ки, понятно, не менял…

Захожу – а оно на sweb перебрасывает… Ну, думаю, может чего у них там не прописалось… Жду до завтра… То же самое.

Смотрю – ответ с кодом 200, и выдается вот что:

< html>
< head>
< meta HTTP-EQUIV="REFRESH" CONTENT="0; URL=http://www.sweb.ru/">
< /head>
< /html>

-сайт нахожу в Яндексе по урлу, там при нажатии на подсветку то же самое выдается… Тырят трафик.

И ведь в чем прикол. Я мог на сайт изначально любую чепуху выложить, но у меня голова никогда бы не дошла до такого – самому редирект на Свеб ставить… Они, выходит, сами…

Быстроробот Яндекса забывчив?

Только что буквально я страдал по поводу постепенного выкидывания одного сайта на 35 тыс. страниц из базы Яндекса… То было 5, потом 3, потом 1.8 тысяч…
А этот сайт умеет заголовки if-modified-since обрабатывать. И на проиндексированные каждым поисковиком страницы он выдает 304 Not Modified – когда надо.
Короче, я взял – обнулил отметки об индексации. Типа начнем сначала. Позавчера уже было 9300 страниц в базе Яндекса.
Сейчас 22.5 тысячи уже. 🙂
Что же это получается? Яндексовский быстроробот как быстро индексирует, так и быстро забывает? 🙂 Не любит он, видно, необновляемые страницы.
PS Рамблер нормально держит все страницы в базе всю дорогу.
Кстати, именно постепенное выкидывание Яндексом страниц может означать именно то, что есть некая дата, до которой страница живет… Ибо сайт новостной – на нем страницы все время появляются… И многие, видимо, устаревают.
PPS Единственно, что при поиске по этому сайту в Яндексе – сплошные “Abort trap”-ы. Быстроробот еще и неаккуратен. 🙂

RSS комментариев к записям

Раньше по урлу http://blog.promosite.ru/rss20-comm.php выдавался фид с числом комментариев в заголовке поста, но без самих комментариев. Неизвестно, кому это было надо. 🙂
Подглядел у Дмитрия Честных, как у него (в вордпрессе?) устроена ссылка из RSS записи на RSS комментариев к этой записи. Собезьянничал.
Теперь по урлу http://blog.promosite.ru/rss20-comm.php выдается к каждой записи ссылка на http://blog.promosite.ru/rss20-comments.php?[id] , по которой идет фид с текстами комментариев. Надеюсь, это кому-то надо.
Плиз: проверьте, кто может – правильно ли все работает. Сам RSS-ридерами не пользуюсь… 🙂
Может, и основной фид надо оснастить этими ссылками?

пример “эксперимента”

Человек сделал хитрейшую весчь: методом заразного маркетинга понаставил ссылок на свой сайт с других сайтов (сделав индикатор pagerank), не получил ожидаемого результата, теперь ждет к себе в гости неких “гуру”, чтобы их “порвать”.
Кстати – непонятно, зачем ему этот pagerank… И ссылки пустые в индикаторе (без текста), нет чтобы заранее подумать… И странички ссылающиеся нулёвые, не удивительно… И вообще непонятно, сколько времени он ждал – может, пиар и появится скоро…
Аналог: http://cbrf.magazinfo.ru – информер по валютам – ссылок всего около 86, PR4, 600-800 хостов в день, подписчиков не считал. И никакого заразного маркетинга и тем более, понтов. Правда, сайт существует подольше, больше года.
Но только в ссылке информера текст есть. На тематические страницы, с разных информеров.

Яндекс: if-modified-since виноват или дубликаты?

Некоторое время назад (то ли год, то ли меньше) сделал я сайтик для экспериментов. Сайтик по определению должен быть “белым”, чтобы жить долго.
Поскольку на сайтике предполагалось иметь много страниц, была введена программная поддержка if-modified-since. Т.е., чтобы лимит на индексацию не забивать старыми страницами, чтобы новые страницы исправно добавлялись.
Сначала Рамблер забрал вообще все и резко, и держит в базе до сих пор. Это 30-35 тыс. специально оборудованных страниц.
А Яндекс – сначала индесировал долго (по 4-5 тыс. в месяц набирал, вдвое дольше Рамблера), так несколько месяцев назад начал выкидывать из базы страницы сайта. То слезло до 3000, теперь уже 1800. Но н еможет вроде Яндекс так хорошо нечеткие дубли выделять, я это точно знаю. Тем более сайт построен так, чтобы кроме самого контента (он состоит из новостей, читабельных и прочая! :)) не было видно никакой обвязки. Практически голый хтмл.
И вычищает их Яндекс!
Вот сижу и думаю – а из-за чего? Сначала думал – из-за низкой цитируемости домена… Это я думал, когда число страниц снизилось до 5000… Теперь 3 – 1.8 тыс… Теперь думаю – либо нечеткие дубликаты научились резать, либо if-modified-since виноват… Опять же, может, дату они чекают? Типа, запрос в прошлое дают и смотрят, скока месяцев инфа не менялась?
Обнулил в базе все отметки о if-modified-since – сайт как будто не проиндексирован Яндексом… Вот и посмотрю, будет ли расти число проиндексированных страниц…

думаю – какой доклад подать…

На конференцию будущую – optimization.ru…
Идеи, в общем, три:
1) посчитать что-то по графу ссылок Яндекса, про имитацию ссылочной структуры нормального инета, средние параметры сайтов разных групп, выделению колец. Но тут слушателей можно перегрузить…
2) продолжить тему магазинов – методы эффективного собирания трафа и проч., но приплести реальную статистику за большой срок. И по ней что-нибудь посчитать, типа как зависит число просмотров от “типа” запроса и лэндинг-страницы, и т.п.
3) продолжить тему экспериментов по вычислению всяких закономерностей с текстовой релевантностью Я, Р, G. Благо эксперименталный сайтик уже давно готов и стоит. ждет своего часа. 🙂
***
советы есть?

самая эффективная работа получается, …

… похоже, тогда, когда она укладывается в один-два дня. Типа – сел – и сделал. И ничего больше не делаешь. Когда начинается перемешивание этой работы с какой-то другой – она забывается и как-то откладывается.
Это я к тому, что опять проперло сесть сделать свой геотаргетинг. 🙂 Доделать, точнее.