Вот вам и лимиты на индексацию в Яндексе

По одному из моих сайтов Яндекс телился-телился, показывал 512 проиндексированных страниц. Месяц, наверное, телился. Хотя я ему скармливал карту сайта аж о 12 страницах (чтобы каждая страница в 100 Кб влезла).
Сегодня порадовал – кажет сразу 9300 проиндексированных страниц. И когда успел! Да, повышенные лимиты. Иначе мне такую индексацию надо было бы ждать… этак 20 недель.
PS анализа If-Modified-Since не было. Засосал новые страницы – и все.

фильтры на ссылки

Яндекс умеет фильтровать тексты ссылок на ссылочно-проспамленный сайт. Но не умеет фильтровать входящий на него ВИЦ.
Рамблер не умеет первого или умеет плохо. Насчет второго не уверен.
У меня в высшей степени выпуклый пример есть, но не покажу.
За/Против у кого какие?

RORER

Gray с внимательностью наблюдает за новой системой RORER и за ее обсасыванием в Вебпланете.
Ну, во-первых, баннеры sucks, это очевидно. Тем более новый формат. Мне вообще кажется, что взяв такой формат, создатели просто хотели вы##нуться и создать информационный повод. Ну да ладно.
Главное.
Важным отличием этой системы, по мнению создателей, является анализ “на лету” содержимого страницы, на которой размещается реклама.
А на фига его, это содержимое, на лету-то анализировать? Ну проанализировали один раз, “поняли” ключевые темы или слова, запомнили и пользуемся.
Пусть даже содержимое страницы часто менятеся. Важна ведь не тематика страницы, а “тематика” читателя.
На страницу юзер может зайти: извне по ссылке, с поисковика, с морды сайта.
А если страница только что появилась, то юзер на нее зайдет… конечно, с морды сайта. Ибо ни поисковик, ни благодарные читатели ее еще не видели.
А тогда нельзя сказать, что юзер заинтересован в содержимом страницы. Он, в общем-то, “нетематический”. Он перешел прочитать новость. А преподносится как суперцелевой. И продается по показам.
Итак, контекст “на лету”, в общем-то, не нужен реально.
А что остается? Обычная контестная реклама. По показам, только подешевле раз в 1-5, чем на поисковиках.
Забавно еще вот что:

Антон Болотов отмечает, что рекламодателю не нужно будет выбирать сайты, на которых необходимо транслировать рекламу.

-пишем “не нужно”, читаем “по-другому не может”:)

Отмечается, что отбор рекламных площадок в Rorer будет индивидуальным, автоматическую регистрацию вводить не планируется. Предполагается, что в сеть будут приниматься только качественные ресурсы

-предполагается, что возникнет обалденный ажиотаж и очередь желающих “вступить”. Что вряд ли, учитывая формат рекламы.

Антон Болотов озвучил несколько площадок, сотрудничающих с Rorer: www.membrana.ru, www.lapsha.ru, www.goodbuy.ru, www.squadron.ru. Он уточнил, что на данный момент реклама Rorer показывается на 10 площадках, а кампания по подключению началась только 1 сентября.

-пытаемся показать, что очередь уже выстраивается. На самом деле, просто люди заранее договорились, как сделал бы любой, или разместили систему на “домашних” сайтах.
Посмотрим…

Занесение сайта в разные рубрики в ЯК-е

Занесли сайт в раздел ЯК “Компьютеры и связь / Hardware / Ноутбуки”. Сайт пока считается “новодобавленным”, т.е., появляется над категорией. При нажатии на пунктик в Я.Баре – перебрасывает на “Компьютеры и связь / Hardware / Универсальное”, ну это ладно.
Сегодня обнаружил вообще странную штуку. Появились заходы из категории “Компьютеры и связь / Hardware / Мониторы”. Сайт и там очутился.
Странно.

Да, Яндекс стал банить быстро…

Не далее как в субботу добавил в Яндекс субдомены с экспериментами… Сегодня они уже запрещены к индексированию.
Кстати, забанены вместе с основным доменом почему-то. На основном домене никаких генеренных текстов не было, даже какой-то набросок будущего сайта был… Видимо, пошли по самому простому пути. 🙂
Что интересно, Яндекс забирал только 2 страницы с каждого субдомена (Рамблер – все забирал), а не весь его. Ходил, кстати, с домена glagol.yandex.ru. Видимо, человек смотрит новодобавленные сайты.
Как хорошо все-таки, что я не использовал реально работающий домен… 🙂
Ну что ж, теперь сгенерим все по-новой и вываливать будем на narod… Вроде там квоты на индексацию повышенные, кстати?

Рамблер и динамика

Вроде все уже привыкли считать, что Рамблер динамические страницы нормально берет.
А вот сам Рамблер думает, что не всегда:

Рамблер обрабатывает все “динамические” страницы с именами вида *.asp*, *.php*, *.pl*, */cgi-bin/* и т. п. для посещаемых сайтов (по данным top100), а также сайтов, содержащих уникальную информацию, полезную пользователям поисковой машины. Для остальных сайтов обрабатывается часть таких страниц.

-т.е., для “не-высоко посещаемых” должна индексироваться “не вся” динамика.
Только осталось понять, какая посещаемость считается высокой. И какой контент – уникальным.

27 МБ словарного мусора

…наконец-то сгенерено для экспериментов над поисковиками и вывалено в Инет.
…увеличим энтропию еще немного. 🙂 Бедные классики русской литературы…

Немного статистики по ЯК

За день нахождения в “недавно добавленных сайтах” в категории ЯК “ноутбуки” сайт получил 33 захода из разных категорий.
Кстати, около 8-10 человек зашло, пользуясь “гео”-группировкой по Москве.

накруточка ссылочного ранж-я

Проскочила в поле зрения ссылка http://www.realty-catalog.ru/?show=links – вот что значит система накрутки внутреннего ссылочного ранжирования (точнее, и внешнего тоже – для sdam-snimu.ru). А ведь у такого сайта тЫЦ 3300!

Сниппет в Яндексе

Запрос в Я ноутбуки iRU – 18 место:

Ноутбуки iRU / Ноутбуки – продажа, найти лучшую цену и выбрать Ноутбук iRU
Ноутбук iRU Intro 1214 CD (30677)
Кроме представленных серий (Ноутбуки iRU Novia, Intro, Stilo, Brava), мы под заказ можем доставить Вам и другие модели.
www.ultraslim.ru/notebooks-cid1-pid18

Прикол в том, что фраза “Кроме представленных серий…и тд” – самая последняя на фоне 30-40 повторений описаний ноутбуков со ссылками.
А выбрал Яндекс последнюю фразу. Сниппет, конечно, нормальный – нравится. Но какого так отрезать все посередине? Интеллект взыграл, что ли? 🙂
Ведь посередине даже повторов нет, названия неодинаковы, характеристики тем более.
Чудеса. Но хорошие.