наши методисты…

Почему-то не читаю рассылку Андрея Иванова по почте, а захожу туда в архив на Сабскрайбе. Когда настроение почитать появляется. 🙂
*** off: наверное, это и есть причина популярности блогов – когда письмо приходит, настроения читать его нет, есть дела разные… А когда почитать охота, письмо уже завалялось и его не найдешь…
Итак, в одном из последних выпусков дали материал ТЕКСТОВЫЕ ПАРАМЕТРЫ РЕЛЕВАНТНОСТИ – в виде методики анализа оптимальной частоты кейвордов. Кстати, он почему-то не подписан… Наверное, методика настолько элементарна, что такую банальность стыдно своим имененем подписать.
Итак, методика.
Начало, “постановка задачи”:

Очевидно, что из перечисленных характеристик мы можем определить только пп. б) и г), размер же базы Яндекса и частота какого-то слова в ней нам неизвестны.

-ключевое слово “нам”. 🙂 “Вес слова в базе” или его подобие, во-первых, можно посмотреть в reqtext (кто знает, тот поймет :)), а во-вторых, частота слова в базе с хорошей прикидкой (плюс-минус 0.3 порядка) пропорциональна числу найденных документов по этому слову. С отклонениями в один-полтора порядка 🙂 для очень частотных слов, вроде “www”, которые часто употребляют на одной странице очень много раз. Проверено reqtext-ом.

Сформулируем еще короче.
Оптимальные веса для разных ключевых слов – различны

-я бы сформулировал подлиннее… Но если покороче :)… Оптимальные веса МОГУТ быть различными, да и не веса, а диапазоны весов. И эти диапазоны могут пересекаться…
Но, собственно, вернемся к методике.

Но опытный веб-мастер знает, что верхние строчки результатов поиска занимают ссылки на авторитетные, хорошо цитируемые сайты, и фактор цитируемости может исказить картину весовых коэффициентов. Поэтому анализировать стоит не только первые 10 позиций, но и посмотреть, каково распределение весов “пониже”, в Тор20, Тор30, Тор50

-странно. А почему не Топ100? Ведь документов по запросу выдается, как правило, куча. Туева. Почему не взять первые 10% хотя бы? Потому, что это очень много и SeMaster.ru не вынесет такого.
Итак, что предлагается.
Допустим, у меня есть мешок картошки и мне в закрытом оборонном НИИ поставили задачу – определить, какие особенные качества должны иметь картофелины, которые при длительном встряхивании мешка “всплывают” наверх.
И я, допустим, взял этот мешок и долго встряхивал, перераспределяя в нем картошку. Ну а потом взял и проанализировал… Ну, допустим, все картофелины из верхнего слоя. Допустим, их там 10… Нет, 10 мало, возьмем 20… 🙂
Проанализируем, и получим фигу. Потому, что всплытие картофелин может определяться не только и не столько их собственными качествами, сколько качествами их утонувших соседей.
Да и хуже того. Картофелины разного размера могут образовать конгломерат :), в котором в промежутки между сферическими 🙂 картофелинами одного размера R помещаются картофелины размера R/6, к примеру… И в вершине мешка будет смесь. Которую нельзя разделить на “оптимальные” компоненты. И усреднив параметр R, мы получим картофелину, которая туда не впишется. (пример – замешивание сайтов в выдачу по тематикам или по жанрам)
Да и еще хуже. При изменении размера картофелины она может по иным законам цепляться за соседей (или не цепляться) и вообще может не существовать оптимального размера…
*** off: это я к тому, что когда-то я выбрал всю выдачу по однословному запросу, и, пробив 4000 страниц, обнаружил, что в последних 2/3 сайтов средняя частота слова в тайтле около 1/3, но они чередуются – то ноль, то 1, то 0.5. То что-то другое.
*** Да, и влияние “общей релевантности” числа страниц с сайта тоже выбрасывать не стоит.
Но все-таки. Ладно, анализируем 20-40 места, строим таблицу и делаем скриншот.
И что бы видим? 2.56% средняя частота. Но в топе результатов (которые по умолчанию полагаются оптимальными или хотя бы более оптимальными, чем остальные :)) есть и 6.5%, и 0.60% – и вообще, огромный разброс. Да и в тайтле, о ужас, разное количество слов нарисовалось…
все поделить (с) Шариков 🙂
А все-таки… Если, скажем, у какого-то сайта цитируемость (по ссылкам правильными словами) ого-го, а процент, ну… допустим, выше оптимального? Пролезет этот сайт за счет цитируемости повыше в выдаче? Пролезет.
А если процент НИЖЕ оптимального? Вот черт… Тоже пролезет.
Тогда какой выхлоп? Семастер помучить и за доступ заплатить в будущем, что ли?
Таки смысла нет усреднять первые N или кусок их первых N. Надо всю выдачу анализировать. Или хотя бы ее значительную часть, в виде N*10% выдачи.
___
ЗЫ Кстати, похожим методом я пользуюсь, отличия – в том, что рассматриваются сайты с минимальными показателями цитируемости, типа чем ц-ть ниже – тем больше внимания обращаю на саму страницу 🙂 Да и то смысла мало при неравных тайтлах и Х1-3.

…а машина без колес

Вчера, ковыряясь в коде нескольких своих больших магазинов (в сумме около 10 тыс. страниц), обнаружил, что я не прописал в категориях и подкатегориях h1. 🙂 Т.е., стилем прописал, а тегом нет. Даже сам не заметил разницы. 🙂
А я-то смотрю и радуюсь, как хорошо идет траф… А тут такая ляпа. То-то народ идет только на товарные страницы…
Ну вот, появилась дополнительная причина переиндексировать сайты…

Рекорд по перекупке доменов

Из 26 освобождающихся вчера доменов, которые привлекли мое внимание, остались НЕ перекупленными 3! (Из них один неплохой и мне по теме, но времени нет заниматься:))
Еще парочку продлили хозяева. А все остальное разобрали любители вторичных доменов. 🙂 Даже накрученные линкатором сайты – и то берут! 🙂 Ну, пусть берут…
Домены в частности, были такие – aferist.ru, pause.ru, saluty.ru, zaplatim.ru, under.ru, hiking.ru, znanija.ru.

Конференция – 2004 finished

http://www.optimization.ru/04/program.shtml
Все вздохнули с облегчением, особенно докладчики 🙂
Что не понравилось. Место проведения конференции (Инфопространство) – во-первых, не видно ни фига со стульев сзади, во-вторых, очереди за едой :), и сзади за бутафорской стенкой все время кто-то ходит и ржет. И то, что регламент сбивался все время…
Что понравилось. Что Инфопространство близко и добираться просто. Что Яндекс повернулся лицом к оптимизаторам, хотя и не совсем, но все же.
Забавно, что и Рамблер, хотя и докладчика не выставил, в круглом столе участвовал в лице В.Шабанова. Видел спаммера из “найтипросто” – как он там популяризовал свои обиды за бан и грозился привлечь общественное мнение. Правильно сделали, что забанили, такое давить в зародыше надо.
Яндекс признал официально существование “подводной” части Яндекс-каталога. Илья Сегалович рассказал о том, что хоть скорость индексации и увеличена, но “хреноватый” контент (в смысле дублирования) они отличать будут и медленнее индексировать.
Я забыл задать вопрос Ломизе про то, почему через задницу работают запросы в Директе – стопслова глотают и т.п. Ну ладно, опосля.
Андрей Иванов популярно показывал возможности макросов А&П – интересно, много ли народу они в платную рассылку привлекут… Надеюсь, они не будут организовывать поиск по рубрике ЯК – не вылежалось еще :).
Герман Осташевский рассказывал про партнерку МастерБелл. Я подивился – программа работает больше 6 месяцев, набрано 33 активных участника, суммарная выплата которым около $3000 в мес. Немного, мягко говоря…
Да, оказывается, с форума не только Lina, но и Interitus работают в AdLabs. У Леши даже визитка была с надписью “почетный оптимизатор” :). А на брошюрках Адлабз надпись что-то вроде “продвижение для избранных” или типа того. 🙂
Доклад Ивана Севостьянова заклевали – типа, ну что за статистика на 50 анкетах? 🙂
С Cherny мы так и почти не встретились.
Андрей Иванов собирается развивать свой “нейрон.ру”, только вряд ли это выйдет…
Кирилл Чистов из Subscribe.ru говорил, что в хороших рассылках от 10% до 40% отклика на ссылку, а на вопрос, почему в хорошей рассылке об оптимизации (АиП) с 50-65 000 подписчиков на ссылку реагируют меньше процента, 300-400 человек… не убедил.
Бегун в лице Алексея Басова анонсировал технологию автоматического определения контекста страницы (страница закачивается в Бегун, обрабатывается и результаты кешируются на некоторое время) – типа, сказал, что это секретная информация, и что прессе будет официально объявлено в понедельник об открытии, а все пока просто имеют щастье знать из первых рук. Пиар, блин. Типа как ты, журналюга, после этого посмеешь не написать о Бегуне? У него было такое счастливое выражение лица, что я даже постеснялся спрашивать, как это они на сайтах с эротическими обоями показывают рекламу услуг фотостудий, типа это контекст? И то после громкой темы на форуме, а до нее на эрообоях была реклама хостингов и услуг вебдизайна.
Авось теперь мелкому сайту войти в Бегун станет проще. Но и качество трафа с Бегуна должно упасть. Видимо, они просчитали это и будут зарабатывать на объеме. 🙂
Ну и я нашел на конференции пару новых поставщиков для развития своих магазинов… 🙂
Вот и вся конференция.

Изменяется время удаления доменов из Реестра RU

Ру-центр меняет время удаления доменов из реестра с 12 утра на 19-30 вечера:

С 10 ноября 2004 года Технический центр домена RU, с целью снижения нагрузки в рабочие часы, изменяет время удаления доменов из Реестра. Теперь процедура удаления доменов будет запускаться в 19:30 (MSK), а не в 12:00 (MSK), как это было до сих пор.

-достали видать, его борцы за домены… 🙂
Видимо, они думают, что после работы людей будут выгонять от компьютеров и они не смогут бороться за домены. 🙂

Кнопки Яндекса – невежливо получается…

Видимо, в результате изменений в Я.Каталоге произошло перемещение соурсов Яндекс-денежек.
Раньше все время кнопки грузились с http://yaca.yandex.ru/cycounter?имя-домена , и тут вчера я вижу – у меня все кнопки в показе экспайред-доменов не грузятся. А прошвырнулся по другим людям, которые Я.кнопки показывают – у них все нормально.
Сегодня зашел на место, где “получают денежку”. Там в src кнопки стоит http://www.yandex.ru/cycounter?имя-домена

Фак! Сначала люди кнопки понаставили, а потом – упс, и они показываться перестали. Мне-то что, шаблон сменил.
__
ЗЫ Честно сказать, я вчера, увидев на первом же сайте нормально показывающиеся кнопки, подумал, что меня зафильтровали (типа реферреры с links.obgon.ru чекали)…

Какие домены-то освобождались сегодня, а?

Домены partners.ru, system.ru, wholesale.ru.
Обычный такой день, даже не вторник :), и такие домены.
Думаете, я за них не боролся? 🙂

Реклама на WebPlanet-е… Ну очень скромная!

После большого перерыва зашел на Вебпланету, на какую-то из внутренних страниц.
Увидел я там рекламку (графический блок в тексте), которую сначала принял за иллюстрацию и внимательно на нее посмотрел (а хитрый ход, а?).
Подумал – как ведь хорошо, не мозолят глаза рекламой, вот молодцы!
И кликнул.
И ссылка открылась в ифрейме!
Гы-гы. 🙂
Наверное, никто не заметил до сих пор – все равно на такие ссылки никто не кликает… 🙂 А реклама магазина hitmart – та вообще ошибку 500 дает, в том же фрейме…
Все, реклама уже никому не нужна. 🙂

Хотлог встал на путь исправления?

Сегодня письмо от Хотлога пришло:

Добрый день!

По многочисленным пожеланиям наших пользователей, мы изменили код счетчика системы Интернет-статистики HotLog, теперь он не содержит таблиц и состоит из одной картинки.
Для замены счетчика на Вашем сайте воспользуйтесь ссылкой “код счетчика” в Вашей учетной записи на www.HotLog.ru.

С уважением,
HotLog Support Team

-хотя я такие письма автоматически убиваю, даже не смотря в текст, сейчас решил посмотреть.
Правда, код не смотрел пока.

Обнаружил ошибку в своем чекере позиций

, который у меня на http://promosite.ru/services/monitoring.php – Апорт что-то изменил в формате, и, видимо, довольно давно. А я только сейчас заметил…
Почекал позиции уже новой версией, и обнаружил, что по важному сайту он меня поставил где-то по 2/3 из длинного списка хороших и очень хороших запросов (ок. 80) на первую страницу…
А я-то уже привыкать стал, думал, что Апорт тормозит… 🙂 Но тормозил не он…