Распределение по числу внешних ссылок

Начал смотреть на хостграф, полученный от Яндекса. Пока пользуюсь Perl, вроде кряхтит не сильно… Но считать на Сях все равно придется.
Итак, график распределения числа доменов по числу внешних ссылающихся хостов:

Т.е. – это группы хостов, на каждый из которых ссылается 1, 2, 3… N внешних хостов (по горизонтали).
По вертикали – число хостов в этих группах. Координаты логарифмические.
Т.к. среди хостов присутствуют “внешние”, еще не скачанные, и часть сайтов есть в ЯК – я разделил их на 3 группы.

Запугал меня Яндекс

Я пугался, когда слышал от Сегаловича, что у них в хостграфе 380 млн. доменов. Это если SiteRank каждому посчитать на 6 байт (число типа real) – будет 4 с лишним гига (как считал, не помню, сейчас получается 2.2). В оперативку не засунешь…
Сейчас посчитал. Оказалось, в хостграфе 4.9 млн. хостов. Жить можно – 30 Мб на хранение ранков.

Гео-статистика по и-магазинам

За апрель на 7 магазинах (данные по Спайлогу) московский траф составил 53% (это 25800 посетителей, траф почти весь с Яндекса). Тематики совершено разные, электроника, фото-видео в основном.

Москва 25809 53,3%
Санкт-Петербург 5515 11,4%
Ниж. Новгород 1076 2,2%
Краснодар 1017 2,1%

Посещаемость службы “Поиск” Яндекса тем временем уже не 30-35% москвичей, а все 38.

тИЦ: домены 3 уровня

По мотивам темы на searchengines и темы в форуме Яндекса от М.Маслова:

ТИЦ окончательно стал рассчитываться на основе доменов 2-го уровня(с небольшим списком исключенй) ресурсов из каталога.

т.е., источником тИЦа могут быть только домены 2 уровня и яндекс-каталожные сайты.
С какими-то там исключениями… Вот интересно, относятся ли к исключениям фрихостинги? Теоретически, нет… А исключение, наверное – narod.ru, свое, родное 🙂
Однозначно не относятся множественные субдомены одного домена – чтобы не накручивали тЫЦ… И всякие бесплатные домены типа .(com|net|pp|org).ru – хотя в той теме говорится лишь о pp.ru, остальное надо проверять…
К чему это должно привести – как минимум, к большой неразберихе среди тех, кто любит меняться с субдомена links. 🙂 Полетят ссылочки по закоулочкам… 🙂
Ну и могучая кучка создателей каталогов тоже спасибо не скажет…
Да вообще, значимость тИЦа должна подрасти… Не так просто его получить-то станет…
А в линкаторах, кстати, мно-ого доменов 2 уровня… Вот и посмотрим, подрастут линкаторные сайты или нет…

Бредни о будущем

Имеем 2 тенденции:
1) Рост мощностей железа при тех же ценах и удешевление нынешнего. Трафик тоже должен дешеветь. Поэтому поисковики будут более производительными и войти новичку станет легче.
2) Засирание интернета всякими текстами. Кучи разных онлайн-дневников, новостных сайтов, партнерок, клонов магазинов, хомяков, сервисов, форумов и т.п. Дорвеев в том числе. Объем информации увеличивается непомерно.
Вопрос, что происходит быстрее? Мне кажется, засирание интернета текстами идет гораздо быстрее. Что из этого будет следовать?
Что поисковик в будущем не только не сможет заиндексировать все, но и ему будет ненужно индексировать все – потому, что 90% “всего” – натуральный мусор.
Или, если сказать по-другому: на каждый доллар, вложенный в индексацию (в железо и траф) имеем некую удельную отдачу (которая проявляется в качестве поиска и лояльности пользователей, например). При индексации “всего, что в рот полезло”, эта отдача будет уменьшаться, поскольку:
* чем дальше, тем больше мусора
* чем дальше, тем больше дублирования информации.

В этом случае на первый план выходит умение поисковика отличать качественную инфу от говна.

Яндексу пока все равно – Рунет маленький. А вот по Гуглу заметно – начал нос воротить от некоторых сайтов и уже давно. Внутрь сайта без ссылок не пойдет… Страницы потеряет…

***
Так эту ситуацию можно “экстраполировать наоборот” – и будет вывод, что для создания качественного поисковика совсем не обязательно индексировать всё. Или, по-другому: сокращение объема индекса на 90% может ухудшить поиск на 10%…
Этакий маркетинговый подход к созданию поисковиков…

Траф по мобилкам – кванто косто?…

Предположим, хотя случай вполне реальный.

Есть шоп по мобильным телефонам, который я сделал и продвинул для клиента. Клиент, правда, не мой, а агентства. Траф – чистейший, целевой, весь народ по названиям моделей идет (типа “бренд модель”), сайт в первой тройке как правило.

Трафа около 2500 хостов в будний день. Из них около половины на т.н. “активные” модели – т.е., те, которые продавать особо интересно, а на “неактивные” просто сделана наценка в 20 баков за неинтересность.

Вот сколько должен стоить траф, а? Клиент создание сайта с оптимизацией в одном флаконе оплатил, а дальше жмется. Мол, заказов нет. Договаривались платить по трафику, от 5 до 3 центов за заход с поиска (типа, до 500 в день – по 5, от 500 до 1000 – по 4, а дальше по 3). Статистика “внутрисайтовая”, честная, под нашим контролем.

Ан говорит, заказов нет… При этом на мыло сыплются копии заказов, из которых только московских – гораздо больше, чем по другим его сайтам, питающимся Я.Маркетом.

Так по деньгам получается около 1200 в месяц… При том, что товарищ не моргает и платит за Маркет около того же косаря – не жужжит… Так он и по 3 цента уже не желает – много ему.

Нет, я отлично понимаю, кто виноват… Но что делать? Отыграть ситуацию обратно – легко…

PS Чур, домен не упоминать. 🙂

Ура! новая статистика запросов Яндекса

Яндекс в своей статистике запросов (кстати, она теперь на домене wordstat.yandex.ru) предлагает посмотреть кроме обычных данных (числа показов Директа и ассоциаций) – статистику по словосочетанию по датам (за полгода назад) и по регионам (с разделением по городам и областям, я, правда, не понял, что такое “Региональная популярность, %”).

Тут все понятно. Отчеты по времени позволят просчитать сезонность разных запросов, а по географии – позволят заказчикам оптимизаторов понять, насколько целевой народ к ним идет (вместо “общих” 30-35% москвичей). Ну и оптимизаторы сделают свои выводы.

Пошел копаться. 🙂

PS Узнал из seoblog.

Яндекс заметил Бегуна

На странице вакансии “Менеджер проектов: рекламные технологии” Яндекс сравнивает свой Директ с Бегуном:

Каковы сравнительные особенности рекламы, размещаемой через системы Яндекс.Директ и Бегун?
Вопрос 3 Каковы сравнительные особенности пользовательских интерфейсов Директа и Бегуна?

-ох, неспроста они сравнивают… 🙂 Небось поконкурировать собираются… Хотя это, кажется, уже не секрет.

исследование эффективности Я.Директ от Webprojects

Сайт webprojects.ru (Иван Севостьянов) опубликовал Исследование эффективности использования контекстной рекламы в системе «Яндекс.Директ».

На первой странице по группе туристических запросов выяснаяется, “сколько они платят”. На мой взгляд, данные о динамике внутри недели ничего не дали – если бы мы сравнивали эти ставки при наступлении (окончании) сезона, было бы интересно. Разница между максимальной и минимальной ставкой… Я бы предположил, что действительно минимальная ставка – 10 центов… 🙂
На второй странице сайтам раздаются баллы – сами критерии интересны (точнее, их набор). Но я так и не понял – а сколько сайтов было рассмотрено, по какой базе проценты подсчитаны? 🙂 Может, Иван эту инфу на сей раз решил мягко замолчать? 🙂
Общий вывод прост – много сайтов, покупающих Директ, объективно плохи (неэффективны) – не используют все возможности влияния на посетителя. А что еще ожидать – ведь Директ открыт для всех, а значит, и для лохов.
На третьей странице даются советы по повышению эффективности рекламы. Советы типа “Платите разумные деньги”, “Серьезно подходите к планированию”, “Регулярно производите мониторинг” и т.п.
На третьей же странице приведены примеры того, как “плохо” иногда составлены страницы в смысле соотвествия контекстной рекламе… Но вот эти вещи – во многом дело вкуса. Хорошие выводы можно было бы сделать при анализе статистики по дальнейшему движению посетителя с этой страницы…