Надумал-таки способ определять ‘самое главное’ зеркало сайта

Итак, если сайт с зеркалом зарегистрирован в Яндекс-каталоге, один из доменов отвалился, то будет показываться “неглавное” зеркало.
Как определить, какое главное и стоит ли покупать освобожденное?
Предположение: когда оба зеркала доступны, в ЯК показывается главное зеркало. Осталось взять где-нибудь кеш страницы ЯК. Взять его можно в Гугле.
Примеры.
1) Завтра освобождается домен positive-pr.ru, который сейчас зеркало positivepr.ru. Какое главное? Ищем в Гугле site:yaca.yandex.ru positive-pr.ru – пусто! Ищем тогда site:yaca.yandex.ru positivepr.ru – находим страницу ЯК yaca.yandex.ru/yca/cat/Business/Marketing_and_Advertising/24.html, в кеше Гугля которой находится тот самый сайт с тИЦом 90, данные от 21 февраля.
2) Завтра освобождается домен blatata.ru с тИЦом 400, зеркало blatata.com, на сайт ведут 157 ссылок из суммарных 300. Какое главное? Ищем site:yaca.yandex.ru blatata.ru – находим искомое в двух категориях ЯК от февраля. Вывод – люди бросили главное зеркало. То же ищем в Ггуле для blatata.com – нету его.
Вот и способ.
Кстати, если цитируемость большая и сайт высоко по иерархии – то может ведь и переиндексироваться та самая страница ЯК. Тогда надо по названию искать.

Зеркала в Я.Каталоге

Вот был у меня вопрос, выраженный в теме Зеркала в Я.Каталоге – какое совсем главное?
А кто-то говорил, что “обратных” примеров не видел. Ну вот пример:
Домен rbistudio.ru – зеркало sweb.ru (завтра освобождается, да и вчера я видел что-то подобное, созвучное, тоже зеркало sweb, видать какой-то чудак купил). 1 ссылка на него.
тИЦ по кнопке – 1700,
тИЦ по “пальцам” – 0, тема “Хостинги”.
Но как он описан в ЯК?
А вот так описан:

“ВГМУ”
http://www.spaceweb.ru/
История и структура университета. Описание факультетов и кафедр. Информация для абитуриентов. Творческая жизнь

Т.е., если недоступно главное зеркало, то показывается “неглавное”. Alex Kirillin, ты же не считаешь, что Sweb когда-то был университетом и попал в качестве главного зеркала в ЯК? 🙂

Дорвеи и учет цифр в запросе Яндексу

Скачал и пробил по запросам дорвейный сайтец http://fardek.front.ru . Человек использовал “подход” – на каждый запрос сделал 3 типа дорвеев.
Что интересно – по всем запросам вылезает “первый”, самый простейший тип дорвея.
Но только для запросов вида “Нокия 1234” – всегда вылезает третий тип. Может ли это быть связано с каким-то иным способом учета чисел в запросе, отличным от учета слов? Вероятно.
Версию о падежах не предлагать – все дорвеи использовали только одну форму словосочетаний.
Позиции вот такие:

fardek.front.ru : http://www.yandex.ru/
Запрос|место Thu Sep 16
17:06:25 2004
BIOS скачать 1
бесплатно скачать клипы 2
библиатеки в сети скачать детская литература научная 1
Doom 3 скачать 10
DVD кодек скачать 2
GTA скачать 3
карта Москвы скачать 2
камасутра скачать 5
Miranda скачать 1
мультики скачать 5
Nero скачать 2
ПДД скачать 2
порно фильм скачать 6
порно скачать бесплатно 10
Putty скачать 1
скачать аську 7
скачать ACDSee 13
скачать бесплатно книги 4
скачать Doom2 1
скачать Doom3 3
скачать эротические игры 13
скачать фильм Ночной дозор 4
скачать Flash Player 7 3
шрифты скачать 8
скачать ICQ lite 10
скачать книгу Ночной дозор 3
скачать mscomm32.ocx 4
скачать Mirc 6
скачать Mozilla 5
скачать нарды 1
скачать Norton Utilities 4
скачать Opera 8
скачать полифонические мелодии >20?
Style XP скачать 1
скачать Warcraft 2 1
скачать Winamp 5 2
Ума Турман Ночной дозор скачать 1
Zone Alarm скачать 1
альтернативная музыка >20?
армянская музыка 10
арабская музыка 10
бесплатно музыка >20?
бесплатная mp3 музыка >20?
Дом музыки >20?
электронная музыка >20?
где скачать музыку 6
халявная музыка 5
качать музыку 20
музыка для мобильных >20?
музыка для nokia 17
музыка для сотовых >20?
музыка для телефонов >20?
музыка из фильма Ночной дозор 1
музыка из игр >20?
музыка из кинофильмов >20?
музыка mp 3 4
mp3 музыка бесплатно >20?
mp3 скачать бесплатно музыку 18
Ночной дозор музыка 5
новая музыка >20?
новинки музыки 7
O Zone музыка 2
программы для создания музыки 3
послушать музыку >20?
поиск музыки >20?
популярная музыка >20?
поп музыка >20?
прослушать музыку 2
рок музыка >20?
русская музыка >20?
скачать бесплатно музыку >20?
скачать клубную музыку 2
слушать музыку >20?
скачать музыку без регистрации 2
скачать музыку mp3 >20?
турецкая музыка 8
транс музыка 14
зарубежная музыка >20?
игры для Нокиа 11
картинки для Нокиа 3
клуб Нокиа 1
мелодии для Нокиа 3310 2
мелодии для Нокиа 7
мелодии Нокиа 2
мобильные телефоны Нокиа 6
музыка для Нокиа 1
Нокиа 1100 4
Нокиа 2100 7
Нокиа 3100 13
Нокиа 3200 6
Нокиа 3310 >20?
Нокиа 3650 12
Нокиа 5100 5
Нокиа 5140 2
Нокиа 6100 13
Нокиа 6220 3
Нокиа 6230 13
Нокиа 6260 1
Нокиа 6510 11
Нокиа 6600 13
Нокиа 6610 19
Нокиа 6610i 1
Нокиа 7200 4
Нокиа 7210 19
Нокиа 7250 10
Нокиа 7610 3
Нокиа 7650 10
Нокиа 8210 18
Нокиа 8310 16
программы для Нокиа 6600 2
полифония для Нокиа 1
полифонические мелодии для Нокиа 1
сотовые телефоны Нокиа 2
Aura fate of the ages прохождение 1
Aura прохождение 1
Братья пилоты Обратная сторона Земли прохождение 2
Братья пилоты прохождение 2
Broken Sword 3 прохождение 2
Черный оазис прохождение 2
Черное зеркало прохождение 3
Готика 2 прохождение 3
Готика прохождение 2
коды и прохождения >20?
Mafia прохождение 1
Мафия прохождение 1
Обитель тьмы прохождение 2
Петька 3 прохождение 3
прохождение Alias 1
прохождение Arcanum 1
прохождение Fallout 2 3
прохождение Fallout 4
прохождение Gothic 2 2
прохождение GTA Vice City 3
прохождение Half Life 3
прохождение игры Гарри поттер и узник Азкабана 1
прохождение игры Князь Тьмы 1
прохождение игры Painkiller 2
прохождение игры Сибирь2 2
прохождение игры Sacred 1
прохождение игры В тылу врага 1
прохождения коды 11
Путешествие к центру Земли прохождение 3
прохождения к играм >20?
прохождение Max Payne 2 1
прохождение Neverwinter Nights 5
Периметр прохождение 2
прохождение Post Mortem 1
прохождение Сибирь2 1
прохождение Splinter Cell 2
прохождение Siberia 2 1
прохождение Suffering 1
прохождение Syberia2 2
Власть закона прохождение 1
анимация для мобильных телефонов 2
аксессуары к сотовым телефонам >20?
база данных телефонов 11
бесплатные картинки для телефонов 2
барахолка сотовых телефонов 4
драйвера для телефонов 13
форум мобильные телефоны 8
коды телефонов городов 1
как выбрать телефон 13
Казанский вокзал телефон 1
лучший мобильный телефон 16
мелодии для сотовых телефонов LG 8
мелодии для сотовых телефонов Nokia 20
модели телефонов >20?
мобильные телефоны оптом >20?
мобильные телефоны Panasonic >20?
мобильные телефоны Philips >20?
найти адрес по номеру телефона 2
обои для сотовых телефонов 6
описание мобильного телефона Samsung x100 2
описание телефонов >20?
полифонические мелодии на телефон >20?
продам мобильный телефон >20?
прайс на сотовые телефоны 8
продам сотовый телефон >20?
программа телефон 11
разблокировка телефона 12
софт для мобильных телефонов 11
сравнить мобильные телефоны 1
сотовые телефоны с фотокамерой 9
сотовые телефоны Simens 9
телефоны Екатеринбурга 5
телефоны Иркутска 3
телефон Курского вокзала 2
телефоны Новосибирска 5
телефоны Петербурга 5
телефоны раскладушки >20?
телефон с АОН >20?
телефоны звезд 5
выбор телефона >20?

А вот попробуем поискать нокиа по сайту fardek.front.ru – сплошняком лезут те самые “третьи версии” довеев:

fardek.front.ru/nokia/nokia82103.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia6610i3.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia72003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia11003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia31003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62303.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia21003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia51403.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62203.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/mnokia3.html (4 КБ) — строгое соответствие

Действительно, может, число в запросе как бы “меньшую роль” играет. Нечто среднее между присутствием слова и отсутствием числа.

Зеркала в Я.Каталоге – какое совсем главное?

Часто вижу ситуации, когда один сайт (за счет когда-то установленного редиректа, а может, и просто из-за одинакового контента) “прилепляется” в Яндексе к другому сайту.
Если этот “ресурс” находится в Я.Каталоге, то должен быть некий “основной” урл зеркала, который и должен выдаваться в ЯК. И выдаваться в поиске.
Но вот в какой-то момент хозяева решают бросить основной домен. А зеркало существует нормально.
Но Яндекс-то не знает, что основное зеркало бросили, он думает, что временные трудности возникли – на то и заводят зеркала, в конце-концов.
И в этом случае он должен показывать в ЯК одно из “неосновных” зеркал – с тем же описанием, но с другим урлом.
Тогда вопрос. Если мы видим expired домен, являющийся зеркалом домена из ЯК – как мы можем быть уверенными, какой именно домен из этих двух в ЯК прописан главным зеркалом?
Теоретически можно думать на предмет – не кого больше ссылок. Но это не метод. Ведь запросто может быть, что когда-то домен был прописан в ЯК, а ссылки ставили в основном на его зеркало.
И тогда, если перекупить зеркало и восстановить, то получишь домен в ЯК, а бывший зеркальный сайт – отвалится.
Примеров такого никто не видел?
Теоретически, можно решать проблему, периодически скачивая ЯК. Или постфактум его кеши из Гугла, – но они смениться быстро могут…

Сколько же ухищрений…

…приходится делать, чтобы посмотреть, в каких именно категориях Яндекс-Каталога зарегистрирован сайт.
Это сначала надо в http://yaca.yandex.ru/ найти www.site.ru (который Яндекс, слава ему, сам исправляет на url=”www.site.ru*”).
Потом взять цитату из названия (проще целиком) и поискать ее так, чтобы нашелся всего один сайт.
И тогда, наконец, мы увидим справа что-то вроде:

Все рубрики:
->Компьютеры и связь (1)
->Hardware (3)

Типы сайтов:
->Публикации (1)

Доколе терпеть?! 🙂

Perl модуль WWW::Google::PageRank

Человек Yuri Karaban сделал perl-модуль для определения Google PageRank.
Поиском на search.cpan.org находится вариант модуля – кажется, этот.

Google PR для экспайред домена

Вот только купил экспайред домен в категории “hardware”. Восстановил, правда, не то, что было, – но по тематике.

Пока домен открывал вчера, тестировал, – PR0 был. Ну я и не удивлялся. Для русскоязычных применений домен покупал.
Сегодня сделал, отладил все, гляжу – PR3!
Восстановился, что ли? Домен я никуда не зеркалил.
Судя по archive.org, сайта не существовало с января.

Яндекс с апдейтами, кажется, зачастил…

Прошлый и позапрошлый были по средам (до этого по вторникам). А еще апдейт образовался в прошлую (кажется) и в эту пятницу (точно).
Изменения небольшие, но есть. Таки на два апдейта в неделю переходим…

тИЦ в “пальцах” и на “кнопке” Яндекса

Раньше всегда было так, что для экспайред-доменов, которые являются зеркалами других сайтов, тИЦ и “тема” в яндексовских “пальцах” были одинаковы с основным доменом и более-менее одинаковы с тИЦ на “кнопке”.
Сегодня увидел 2 примера зеркал, только впечатление такое: на “пальцах” тематика сайта – такя же, как у основного домена, а вот тИЦ – его собственный, по ссылкам лично на него.
Еще такое впечатление, что при поиске “кто ссылается” из Я.бара – хрень откровенную показывает. По крайней мере для неглавного зеркала – должно выдавать ссылки на оба зеркала, а выдает такие страницы, на которых вообще ссылок нет ни на одно из зеркал…

Яндекс-баги

При поиске в Яндекс-каталоге:
1) При вводе в конце запроса после кавычки пробела (пример: “сайт” ) – “отваливается” оформление
2) Вообще при любом поиске с кавычками (пример: “сайт” плюс надо нажать еще раз “Найти”) у меня на MSIE 6.01 возникает ошибка яваскрипта (unterminated string constant). Интересно, я не один такой?

Кстати, сейчас только увидел. При поиске слева очень удобно предложены рубрики для сужения поиска.