Зашел сейчас в Яндекс посмотреть про перевал Цирк 2А – и 6-м номером сайтик на by.ru:
Алтай 1998. Домашняя страничка Александра Люлина.
2А- р.Катуньпер.Арсенал 1А- р.Белая Берель- пер.Цирк 2А- пер.Туристов 1Б- пер.Титова 2А- оз.Аккемское- пер.Кузияк н.к.- пос.Тюнгур- Телецкое озеро- г …
http://lulinalex.by.ru/Texts/Tourism/Reports/Alien/Altay/1998.htm
Захожу туда и вижу: сайт удален (на самом деле не удален, а “перемещен в архив”, но это только если вчитаться):
Документ перемещён.
Вы запросили страницу сайта «lulinalex.by.ru», который не обновлялся слишком давно, был посчитан устаревшим и перенёсен в архив. Последняя редакция сайта произошла 360 дней назад: 1-го сентября 2004-го года. (*)
Что можно сделать?
* Чтобы увидеть архивную страницу, вам достаточно пройти по этой ссылке. Система распакует для вас сайт «lulinalex.by.ru» и некоторое время вы сможете ходить по всем его страницам.
* Вы можете вернуться на предыдущую страницу и пойти другой дорогой.
* Наконец, актуальную информацию вам могут дать поиск или каталог:
-только не жмите на ссылку распаковки! 🙂
Ну и там ссылки на байрушный каталог от Бегуна.
Но что удивило. “Нормальные” накрутчики кликов с 404 страниц, типа Агавы – все же перебрасывают на 404 страницу! А здесь – ни фига, по тому же URL все расположено.
Ну ладно, думаю. Может, она 404 в коде http дает? Проверяю через сервис http://seolab.ru/add/header.htm – нет, 200 ОК. Тогда почему он в Яндексе есть, да еще от 2002-2003 года? Нечисто, думаю…
Что оказалось. Экспериментируем с if-modified-since (ставим минус один год) – в том же сервисе на seolab.ru проверяем http://lulinalex.by.ru/Texts/Tourism/Reports/Alien/Altay/1998.htm – оно дает:
HTTP/1.1 200 OK
Date: Sat, 27 Aug 2005 06:00:09 GMT
Server: Apache
Accept-Ranges: bytes
X-Powered-By: PHP/4.3.1
Set-Cookie: extract=1125122409; expires=Sat, 27-Aug-2005 18:00:09 GMT; path=/; domain=lulinalex.by.ru
Connection: close
Content-Type: text/html; charset=WINDOWS-1251
Content-Language: ru
Но это с User-Agent: MSIE! А если поставить User-Agent: Yandex, получится:
HTTP/1.1 304 Not Modified
Date: Sat, 27 Aug 2005 06:00:29 GMT
Server: Apache
Connection: Keep-Alive
Keep-Alive: timeout=5, max=80
ETag: “ba8f87-33cfe-29d67540”
Vary: Host
-короче, By.ru делает вид для поисковиков, что сайт типа есть и не менялся, а сам чужой траф гонит на Бегуна.
Ну не козлы, а? 🙁
PS Не исключаю, что и сами авторы сайтов не знают… А кто знает, пойдет отключать “архивацию”?