А не скачать ли нам базу ссылок рунета?

Я, в порядке яндекс-гранта, игрался с базой ссылок между хостами яндекса. Чувствую – этого мало… Хочется знать с каких внутренних страниц поставлены ссылки… Можно поточнее приблизить русский PageRank. Кроме того, частенько по сниппетам понятен текст ссылки.

Короче, есть предложение. Скинуться деньгами и скачать по 500 тыс. хостов ссылающиеся на них страницы, и по новым найденным хостам – тоже. Информацию поделить.

На февраль этого года было около 500 тыс. проиндексированных Яндексом хостов. Из них с половины примерно хостов были внешние ссылки на проиндексированные Я. сайты.

Тарифы на яндекс-хмл: http://help.yandex.ru/xml/?id=396583
более 500 тысяч – $2 за тысячу.

По моей оценке, за 7 месяцев число проиндексированных хостов могло подрасти примерно на 200 тыс. максимум. Если исходить из расчета 700 тыс. хостов = 700 тыс. запросов к ссылающимся = $1400 в деньгах.

При этом у 50% хостов ссылающихся не будет, у 90% хостов число ссылающихся в пределах 10. Остальное надо копать вглубь, но в массе это сильно не увеличит число требуемых денег.

Инфу в сыром виде либо обработанном раздать всем участникам гешефта. Если десяток человек наберется – по $140 с каждого получится.
В качестве стартовой базы можно использовать Яндекс-каталог.
Кому интересно, отмечаемся на searchengines.

Классный юзерпик, — отчетливо сказала Эллочка

Изучающим распространение “баянов”.

Изначально нашел здесь, а т.к. ходить по ссылкам в поисках источника лень, пошел в blogs.yandex.ru и на 13-й странице нашел самое раннее упоминание в LJ nadia_yacik от 2005-04-18, ссылающайся на самый ранний источник на авто.ру.
*** Итак:
Почти по Ильфу и Петрову…

Эллочка с шиком провезла стулья по Варсонофьевскому переулку. Мужа дома не было. Впрочем, он скоро явился, таща с собой портфель-сундук.
— Классный юзерпик, — отчетливо сказала Эллочка. Все слова произносились ею отчетливо и выскакивали бойко, как горошины.
— Здравствуй, Еленочка, а это что такое? Откуда стулья?
— Пазитиф!
— Нет, в самом деле?
— Гламурно!
— Да. Стулья хорошие.
— Готично!
— Подарил кто-нибудь?
— Ужоснах!
— Как?! Неужели ты купила? На какие же средства? Неужели на хозяйственные? Ведь я тебе тысячу раз говорил…
— Эрнестуля! Выпей йаду!
— Ну, как же так можно делать?! Ведь нам же есть нечего будет!
— Фтопку!..
— Но ведь это возмутительно! Ты живешь не по средствам!
— В газенваген!
— Да, да. Вы живете не по средствам…
— Где модератор?
— Нет, давай поговорим серьезно. Я получаю двести рублей…
— Выпей йаду!
— Взяток не беру… Денег не краду и подделывать их не умею…
— Ханжа, убей себя!..
Эрнест Павлович замолчал.
— Вот что, — сказал он наконец, — так жить нельзя.
— Помой хобат, воняет, — возразила Эллочка, садясь на новый стул.
— Нам надо разойтись.
— В Бобруйск, жывотное!
— Мы не сходимся характерами. Я…
— Низачот, парниша.
— Сколько раз я просил не называть меня парнишей!
— Оффтопик!
— И откуда у тебя этот идиотский жаргон?!
— Афтар, учи албанский!
— О черт! — крикнул инженер.
— Готично!
— Давай разойдемся мирно.
— Фтему!
— Ты мне ничего не докажешь! Этот спор…
— Каменты рулят.
— Нет, это совершенно невыносимо. Твои доводы не могут меня удержать от того шага, который я вынужден сделать. Я сейчас же иду за ломовиком.
— Жжош!
— Мебель мы делим поровну.
— Ужоснах!
— Ты будешь получать сто рублей в месяц. Даже сто двадцать. Комната останется у тебя. Живи, как тебе хочется, а я так не могу…
— Слив защитан, — сказала Эллочка презрительно.
— А я перееду к Ивану Алексеевичу.
— Ахтунг!
— Он уехал на дачу и оставил мне на лето всю свою квартиру. Ключ у меня… Только мебели нет.
— Ахуеть, дайте две!
Эрнест Павлович через пять минут вернулся с дворником.
— Ну, гардероб я не возьму, он тебе нужнее, а вот письменный стол, уж будь так добра… И один этот стул возьмите, дворник. Я возьму один из этих двух стульев. Я думаю, что имею на это право?..
Эрнест Павлович связал свои вещи в большой узел, завернул сапоги в газету и повернулся к дверям.
— Картинки не грузятся, — сказала Эллочка граммофонным голосом. — До свиданья, Елена.
Он ждал, что жена хоть в этом случае воздержится от обычных металлических словечек. Эллочка также почувствовала всю важность минуты. Она напряглась и стала искать подходящие для разлуки слова. Они быстро нашлись.
— Киса, ты с какова горада?
Инженер лавиной скатился по лестнице.

Байки из склепа

Был у меня домен delomag.ru, купил его для нужд, а пока не использовал – вывесил на нескольких его субдоменах (10-20) эксперимент с генеренными текстами, и домен быстренько побанили. Продлять не стал.
Шло время, домен перекупили после освобождения (наверное, по принципу – раз кому-то надо было, значит и нам сгодится), разместили на нем проект на тему.
А сайт так и остался забаненным в Яндексе (“не был внесен в базу Яндекса, так как его индексация запрещена”) и Рамблере (“Ваша страница не может быть принята к регистрации”).
А мужики-то и не знают. 🙂
PS Из одного разговора – в Яндексе для обучения алгоритмов не скачивают забаненные по дорвеям сайты, а хранят только их урлы. Наобучаются. 🙂

поспешные выводы…

Вот тут я увидел отчет об “эксперименте” Вадима Ласто, который сделал индикатор PR, получил ссылки, и ожидал счастья, но его не наступало.
Многие высказались в комментариях (меня там не было), и Вадим Ласто подытожил:

Будем считать, все высказались. А потому можно сформулировать некоторые предварительные соображения.
Вывод первый, как водится, к делу не относящийся.
Неожиданно, но факт.
Лёгкий стиль изложения в ненапрягающей манере, так культивируемый на Западе, в условиях Раши даёт побочный и совершенно дикий эффект. Почему-то у читателя создаётся впечатление, что написано это полным профаном, и каждый считает своим долгом разразиться сакраментальным “кг/ам”. Никакого глубинного смысла никто даже не пытается разглядеть- видят только то, что сформулировано вербально, без интерпретации и контекстного осмысления.

Добро. Будем впредь писать так, чтобы аж скулы сводило. Не обессудьте.

Теперь по сабжу.
Господа, речь вовсе не о том, что “ам”, и потому написал полную блажь, пребывая в блаженном состоянии наивного несмышлёныша, либо хорошенько приняв на грудь, и не найдя для себя лучшего занятия, чем испоганить пару виртуальных страниц формата А4. Если кто не понял, выше утверждается буквально следующее: простые баки без текста в якоре фактически не дают вклада ПиЭр. Более того, и скорее всего, на них и внимания-то не обращается. 4 месяцев вполне достаточно для обнаружения баков, среди коих есть сайты с PR 3-4. Про двойки и единицы даже и речи не идёт- это обыденность. А имеем мы со всего этого ровно ноль.

Понятно, что это явно видно только в сравнении с классическим случаем (текстовый якорь). Там абсолютно то же самое, только в миниатюре и меньших масштабах, легко даёт ожидаемую двойку, по поводу чего не возникает никаких вопросов. Это, естественно, проделывалось.

Ну а то, что по запросу Google Page Rank при поиске по русскоязычным ресурсам Гугл даёт первое место (на сей момент) не интересно в принципе и к делу не относится. Разговор идёт лишь о PR и его явном несоответствии математическому ожиданию в данном конкретном случае.

Возможно, отрицательно сказалось небольшое время эксперимента (хотя для “классического случая” его оказалось достаточно- интересно, правда?). Однако что-то мне подсказывает, что лимитирует вовсе не данный фактор
Да, и попрошу расценивать это именно как эксперимент. Увидел эффект, заметил, что результат явно неадекватен, сказал об этом. Всё просто, краевые условия экспириенса оговорены чётко, и попрошу не выходить за эти рамки, комментируя тут абсолютно левые относительно темы обсуждения вещи.

Особенно выделю слова:

Если кто не понял, выше утверждается буквально следующее: простые баки без текста в якоре фактически не дают вклада ПиЭр. Более того, и скорее всего, на них и внимания-то не обращается. 4 месяцев вполне достаточно для обнаружения баков, среди коих есть сайты с PR 3-4. Про двойки и единицы даже и речи не идёт- это обыденность. А имеем мы со всего этого ровно ноль.

-вот как оно…
А на самом-то деле, если зайти на http://lasto.com/google/ – там красуется ожидаемый PR=3. Просто PageRank недавно пересчитали.
Я так считаю, это не просто эксперимент – это два эксперимента. 🙂 Второй – про поспешные выводы.

Вуду-маркетинг

Довольно давно читаю блог Константина Длуцкого Синтетический маркетинг, только сейчас сподобился посмотреть в его ссылки справа.
Там есть шикарная статья Вуду маркетинг. Много параллелей между маркетингом и шаманством. 🙂 Особо классных цитат дать хотел, но напрягаться не буду – у него там защита от копи-паста.

Недеяние есть благо

Ну, я давно в этом убеждался, тем более, что оно совпадает с моей ленью… 🙂
Вот посещаемости сайтов по мейлрушному счетчику:

(1) Падение посещаемсоти в пару раз, я даже думал, что это пессимизация 🙂
(2) Ситуёвина выправляется
(3) Вчера.
🙂

Можно сформулировать принцип: даже если оно не работает, все равно не трогай. 🙂

Интересный эффект: подстановка ссылок в тайтл

Где-то я это уже видел в Яндексе, но потом основательно подзабыл…
Прикольный эффект – если тайтл у страницы пустой, Яндекс в тайтл поставляет текст ссылки.
1) Простор для того, чтобы кого-нибудь забывшего тайтлы прописать, сильно обидеть, понаставив достаточно нужных ссылок… 🙂 Причем обидеть от его собственного лица. Ведь юзер воспринимает текст ссылки в выдаче как родной тайтл сайта
2) Простор для того, чтобы делать контекстно-зависимые тайтлы в Яндексе. Типа, юзер набрал один запрос – ему один тайтл. Набрал другой – на тебе другой! И никакого мошенничества 🙂
Я как увидел такое, начало башню потихоньку срывать… Потом вспомнил про ссылки. Но я не думал, что Яндекс может разные тайтлы делать, думал, он обязательно сотворит попурри из ссылок и будет это как одинаковый для разных запросов тайтл использовать… Раньше он как раз такую мешанину выдавал… Но хотя бы было понятно, что это не родной текст.

Примеры:
ссылка на aliance3plus.ru обязательная (1-й)
ссылка на aliance3plus.ru (1-й)
aliance3plus.ru (2-й)
#url=”www.aliance3plus.ru” – настоящее положение дел 🙂

И ведь оно не пишет, что “найден по ссылке”! Вот это нехорошо.

PS Еще для сравнения:
полезные ссылки #url=”www.aliance3plus.ru”, полезные #url=”www.aliance3plus.ru”, полезные && #url=”www.aliance3plus.ru”, альянс && #url=”www.aliance3plus.ru”

sweb.ru – докатились…

Я давно знал, что хостинг spaceweb ( www.sweb.ru ) покупает брошенные домены и зеркалит их на себя: http://blog.promosite.ru/comments.php?199 и http://blog.promosite.ru/comments.php?92

Но теперь уже совсем обнаглели…

Захостил я у них домен, а выкладывать то ли ничего не стал, то ли выложил заглушку. Типа пусто. А вот недавно новое содержимое выложил на хостинг, нс-ки, понятно, не менял…

Захожу – а оно на sweb перебрасывает… Ну, думаю, может чего у них там не прописалось… Жду до завтра… То же самое.

Смотрю – ответ с кодом 200, и выдается вот что:

< html>
< head>
< meta HTTP-EQUIV="REFRESH" CONTENT="0; URL=http://www.sweb.ru/">
< /head>
< /html>

-сайт нахожу в Яндексе по урлу, там при нажатии на подсветку то же самое выдается… Тырят трафик.

И ведь в чем прикол. Я мог на сайт изначально любую чепуху выложить, но у меня голова никогда бы не дошла до такого – самому редирект на Свеб ставить… Они, выходит, сами…