контора по имени Original Content намонстрила 12 с половиной тысяч сайтов – http://sergeax.livejournal.com/1300746.html
sedo от Гугля – http://www.google.com/domainpark/
“вицерастрачивающая” акция хостинга РБК (кстати, хостинг говно) http://hosting.rbc.ru/ru/news/index.php?id35=136 – по доллару в месяц за ссылку с морды предложили…
Рубрика: SEO и поисковики
Блог Вебальты
Блог Вебальты
http://altaforum.ru/
Webalta и Turtle – близнецы-братья?
Есть у меня акк с большим количеством доменов на нем 🙂 Так вот недавно поисковик http://turtle.ru начал его ронять – делал до 5-10 запросов в секунду. На разные домены, естественно, с интервалом вполне приличным по каждому домену. А Вебальты в это время на наблюдалось особо на этих сайтах.
Ну, я его в роботсе прикрыл. Что характерно, почти сразу он отвалился от сайтов.
Тут наоборот, http://webalta.ru примерно то же самое начала делать – по нескольку запрорсов в секунду гнать. Тоже пришлось закрыть в роботсе, тоже быстро отвалилась…
***
Вот сижу и думаю – может, они как-то связаны? 🙂 Учитывая то, что Д. Крюков “неспешно ищет сотрудничества” – объява на морде turtle… Вай нот.
Документы в Яндексе – размеры
В http://company.yandex.ru/ написано:
В поиске Яндекса сегодня
сайтов: 2 533 866,
веб-страниц: 875 760 238,
объем проиндексированной
информации: 22 538 ГБ.
Когда-то я подбивал статистику по средним параметрам страниц в рунете, сравнивал ее с разными данными – вроде все отлично сходилось. По этой статистике получалось, что текста в html-документе в среднем 6 кБ, а вместе с кодом – 17 кБ. Вряд ли статстика принципиально изменилась…
Берем 17000, умножаем на 875760238 – получаем 13.54 ТБ.
Берем 6000, умножаем на 875760238 – получаем 4.78 ТБ.
***
А у Яндекса написано, что объем проиндексированной информации – 22.5 ТБ. Нестыковочка.
Я вот всегда считал, что проиндексированная информация – это типа тексты страницы. А весь скачанный код – не хранится.
Неужели проиндексированное по-Яндексовски – это скачанное?
PS И даже так, что если скачано 22.5 ТБ – то неужели средний размер страницы почти в 2 раза увеличился?
Прайс на Яндекс-XML поменяли
Прайс на Яндекс-XML сменили – увеличили бесплатное ежедневное число запросов до 1000.
А с оптовой частью прайса поступили интересно – “более 500 тысяч” раньше стоил $2/1000, а теперь 100 рублей (3-4 бака).
Но зато
Если вы планируете использовать Яндекс.XML в целях получения данных для различных аналитических систем, стоимость запросов уменьшается в 4 раза. При этом сервис предоставляется только в течении части суток, с 0 часов до 12.00 и с 18.00 до 24.00 по московскому времени. Это предложение может быть интересно для оптимизаторов и разработчиков программ класса data mining.
The $39 experiment
Эксперимент по рассылке писем с просьбами о халявных образцах продуктов у случайных компаний. http://www.the39dollarexperiment.com/
Внизу – таблица с разультатами и письмами. 🙂
nt-mdt
Оказывается:
1) Рамблер чистит свой адстат: запроса nt-mdt в списке nt-mdt-порно-рефераты уже нету, а раньше этот запрос был, и в большом количестве
2) Казалось бы, при чем тут Лебедев? 🙂 Не связано ли это повышение популярности запроса с их активностью?
Яндекс.Блоги вышли из беты
Пресс-релиз о выпуске Я.Блогов.
На http://blogs.yandex.ru/ из интересного:
популярные блог-хостинги
LiveJournal (40 622 записи вчера) LiveInternet (20 834) Diary.ru (9 584) Блоги@Mail.Ru (3 935) MSN Spaces (385) Рамблер • Планета (162) LJ.Rossia.org (62)
– я и не думал, что li.ru так велик и LJ.Rossia.org так мал…
И в расширенном поиске появились поля “Категория, Музыка, Настроение”. На фиг надо, непонятно.
Искать только: в блогах в форумах в прочем – что такое “прочее”, тоже непонятно. У чего еще RSS бывают, кроме блогов, форумов и новостей? У сайтов иногда бывают, но ведь это другая тема.
*.h16.ru стал индексироваться!
Вау, а *.h16.ru стал индексироваться! И даже не слеплен в один сайт, как h15…
Пеар работает 🙂
Поиск доменов регулярным выражением
Сделал себе игрушку: http://domains.promosite.ru/
Позволяет искать зареганные домены в зоне .RU с использованием регулярных выражений. База от 11 марта.
Поиск медленный, просьба не насиловать.
Ну, достали куцые сервисы по поиску доменов…