Об склейке

В камментах у Носика феерическое количество "чудаков", каждый имеет собственное мнение 🙂, причем авторитетно обосновывает 🙂
По вопросу – надо ли редиректить на один субдомен с алиасов.

Спор интернетчика с оптимизатором
На bfm.ru стоит принудительный редирект.
Он ведёт на www.bfm.ru
Меня это совершенно бесит, и я потребовал, чтобы человек, набравший http://bfm.ru/ , туда же и попадал бы, без мозгоебли.
На что оптимизатор категорически возражает, говоря, что мы рискуем некорректной склейкой в Яндексе и потерей части поисковых переходов.

Я походил по сайтам, проверил.
На РБК стоит редирект на www.rbc.ru. На Ведомостях тоже. На Ленте.Ру и Коммерсанте редиректа нет.
Учитывая PageRank=8, который у четырёх перечисленных изданий одинаков, эти примеры ничему не учат.

Какие будут мнения?

Носик, конечно, тоже молодец, "учитывая PR=8" сказать ничего нельзя, это вообще не об этом.
Там и Апач отметился, и преподаватель Каширин 🙂 Неправы.
И Попков. Он прав, имха. Надо редиректить.

Это ж несложно – взял, прописал в хтакцессе, и все. И работает гарантированно во всех поисковиках, а вот директива Host – во первых, только для Яндекса, и во вторых, кривизна склеек у яндекса велика.
Машинам вообще доверять западло, надеяться на правильную работу яндекса – лучше самому что-то сделать. 2 варианта директивы лучше одного.

Особенно это важно для сайтов с быстро меняющимся контентом. Если просто строчку случайную в индексную страницу добавить – и то расклеит две морды / и /index…

Хотя если новостной ресурс хорошую долю трафика получает с поиска – ресурс говно по определению. Новостные ресурсы вообще от поиска не должны зависеть, на них должны из закладок или набором ходить.

И ведь подстановка в адресной строке при наборе "bf*" сама выпихивает сайт "www.bfm.ru", т.е., даже для набора разницы нет.

И куча набежала каких-то придурков, которые про анахронизм начали болтать… Привычный анахронизм становится стандартом де-факто 🙂

PS И Анатоликс отметился с камментом "в robots.txt есть директива хост которая говорит поисковикам какое зеркало главное", только он, наверное, забыл, что кроме Яндекса еще другие поисковики существуют 🙂 Это похоже на "дефолт-сити" – Яндекс – дефаулт-поисковик.

Сегодняшний ап Яндекса – зарубежный индекс?

На сёрче сегодня тема про ап, но говорят, что подвижки маленькие.
Мой апометр ничего не показал, Ивановский тоже.
С другой стороны, Яндекс-вебмастер говорит, что ап.

У меня на апометре за сегодня цифры такие – в час ночи появилось 300-400 тыс. сайтов с датой от 3-5 декабря, в 2 ночи вывалено еще по 300-400 тысяч сайтов за 6-8 декабря.

Но по норме (с датой 2 декабря и раньше) бывает 1.7, 2.8, 3.1 миллиона сайтов. Т.е., это не норма. А у меня как раз чисто по числу сайтов смотрит, там быстроробота еще много подмешивается, поэтому малые числа сайтов апом не считаются. 🙂

А не зарубежный ли это индекс? Смотрим запросы с датой по домену com (это все в XML лучше смотреть):
date="20081203" domain="com" /(1 1) domain="root" – 125 тыс. сайтов
date="20081204" domain="com" /(1 1) domain="root" – 151 тыс. сайтов
date="20081205" domain="com" /(1 1) domain="root" – 169 тыс. сайтов

А по домену ru:
date="20081203" domain="ru" /(1 1) domain="root" – 77! сайтов
date="20081204" domain="ru" /(1 1) domain="root" – 58! сайтов
date="20081205" domain="ru" /(1 1) domain="root" – 111! сайтов

При этом за второе декабря, выложенное в прошлый ап, date="20081202" domain="ru" /(1 1) domain="root" – 455 тыс. сайтов, все штатно.

Так что я думаю, зарубежный индекс выложили. Поэтому и изменения у всех маленькие.

Как, скажите – надо ли в апометр добавлять отдельную пробивку зарубежного и русского индекса, например, таким образом? Или на фиг?

UPD Кажись, начали откатывать – за 5 и 4 декабря в час дня было уже 98-160 сайтов 🙂

мой доклад на конфе выложен

14-го мой доклад на ашмановской конфе 2008, и презентация – выложены на bdbd.ru
Необычно как-то в пдфе. 🙂

‘Использование особенностей языка запросов поиска Яндекса для исследований’
Евгений Трофименко (начальник отдела исследований и аналитики, ‘Корпорация РБС’)
Яндекс – не только наиболее популярный поисковик в Рунете, но и наиболее открытый к исследованиям его алгоритмов. Рассмотрены особенности работы поиска по текстам ссылок, возможности для изучения трактовки Яндексом многозначных запросов и их расширения. Отдельные элементы переформулировки запросов Яндексом, полезные для оптимизации сайтов.

Основные пунктики:
1. отбор НПС-результатов [слово -слово”>
2. вычистка НПС, оценка доли НПС [запрос ~~абракадабра”>
3. исследование расширения запросов операторами исключения
4. отмена контекстных ограничений в новом колдунщике (точнее, колдунщика вообще нет больше)

API Яндекс.Карт

Яндекс.Карты апи запустили: http://api.yandex.ru/maps/
Сразу увидел прикольные слова:

Геокодер — сервис для определения координат географических объектов по их названиям или адресам.

Вроде в гугле такого не видел, хотя м.б. невнимательно читал, полюбому английский язык – зло, переводить и думать надо 🙂
Я как раз придумал, что по названиям Google maps тоже объекты выдает, и их можно парсить… А тут фича.

Тезисы мои у ашмановцев – неправильные :(

Официально заявляю, что тезисы моего доклада, опубликованные у ашманова на программе конференции – полное фуфло, я такого не писал (название доклада правильное, ‘Использование особенностей языка запросов поиска Яндекса для исследований’):

Конкурентность тематик в поисковой выдаче Google. Наличие поискового спама. Отличия алгоритма работы в англоязычном и русскоязычном сегменте.

Это все хрень собачья, я такого не писал. Не знаю, из какой жопы этот текст взялся.
Правильные тезисы звучат так:

Яндекс – не только наиболее популярный поисковик в рунете, но и наиболее открытый к исследованиям его алгоритмов. Рассмотрены особенности работы поиска по текстам ссылок, возможности для изучения трактовки Яндексом многозначных запросов и их расширения. Отдельные элементы переформулировки запросов Яндексом, полезные для оптимизации сайтов.

Откуда там вообще гугль взялся???

Как я это нашел: сегодня в ленте у sonja прочитал и сильно удивился..

И ведь это хрен знает сколько там висит…

PS Про гугль у меня ничего не будет, короче.
PPS Особенно радует "соответствие" названия доклада и тезисов. Там про яндекс, а тут вдруг про гугль.

Гугль индексирует сканированные PDF

Гугль пишет: http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html

Приведены примеры запросов, сканенные документы в выдаче:
http://www.google.com/search?q=public+statements+iraq
http://www.google.com/search?q=theory+of+interstellar+trade

Интересно, жырнее весит, чем обычный текст? Нагенерить дорвеи-то посложнее будет 🙂 Сейчас все начнут сайты сканированные делать 🙂

via

http://www.google.com/brains – 404 Not Found

Тов. Мэтт Катс сообщает, что Google protects itself from zombies – типа у него в robots.txt написано:

User-agent: zombies
Disallow: /brains

Смешно. А я попробовал зайти на http://www.google.com/brains – 404 Not Found.

Мозги у гугля не найдены, короче. 🙂

Гурешовский поисковик “Янга”

на роеме пишут, что Гурешовский поисковик “Янга” не только заработал, но и научился показывать обратные ссылки на сайты
Смешно, что там сейчас написан бесплатный домен http://yanga.net.ru/ , а тов. под ником ludkiewicz смотрел на http://www.yanga.co.uk/ , который был прописан в теме. Меняют на ходу, что ли? Копят восимисят рублей на домен? 🙂

Особенно мне нравится это “не только заработал, но и …”. 🙂 Заработать просто – это вообще достижение.

Кто-то там написал, что малая глубина индексации, хуже, чем у яху. А Гурешов пишет, что “Количество беков будет увеличено в ближайшую неделю в 100 раз”.

Интересно, а что там у Гурешова с Вебальтой? Что-то они стали разбрасываться. Хотя может быть, что у вебальты там куча инвесторов, выибут, есличо. И Гурешов решил свой отдельный личный поисковик сделать? 🙂

rusppc vs Valez

Лол.
Некий русппц (я уже в них запутался уже) написал мегажалобу на всё и вся на тему "Яндекс и Google не любят блогхостинги". 🙂

Проведено и успешно провалено 2 эксперимента с блогхостингами.

Суть первого заключалась в создании на LiveJournal сетки автонаполняемых сплогов и использовании её в последствии в качестве трамплина для быстрого пуска своих MFS/MFA сайтов. Была создана тестовая сеточка на 100 ЖЖ-аккаунтов, записи на автомате по расписанию подло импортировались из другого заведомо нелюбимого Яндексом блогхостинга. Сетка перелинковывалась между собой рандомно постовыми. По истечении месяца в индексе Яндекса не обнаружено присутсвия ни одного аккаунта!

А между тем недавно Valez (то ли создатель лирушных блогов, то ли типа того), написал, что лиру вопасносте – "копии наших дневников, сделанные ботами в ЖЖ".

Непонятно до конца с какими целями, ради накрутки числа записей в блог.яндексе, которая, безусловно, существует или ради влияния на рейтинги авторитетности в том же блог.яндексе происходят такие вещи, о которых я не могу не сказать сразу же, как узнал сам.

я-Михаил обнаружил, что в livejournal создаются копии дневников, думаю не только нашего сайта, а вообще любых дневников. Вот найденные им примеры

Прикольно. Вот бы кто бы из доброжелателей послал Валезу координаты русппц. 🙂

Яндекс-вебмастер: переходы и показы сайта

Gray сообщил, что консоли вебмастера появился отчет "Поисковые запросы" – в нем приведены 25 самых популярных запросов, по которым данный сайт показывался, и еще 25 – по которым на сайт переходили из результатов поиска.

Круто. Теперь можно прикидывать и кликабельность разных запросов, и кликабельность разных мест выдачи, и кликабельность разных сниппетов.

Обнаружил, что у запроса "как открыть свое дело" CTR 9-й позиции – ажно целых 10%. Зато у запроса "статистика запросов" CTR 6-й позиции ~ 0.6%. С моими сниппетами, конечно. 🙂

Жаль – 25 топовых показов и переходов маловато :)..