Статистика по операторам колдунщика Яндекса

Вот так по нашей массе запросов колдунщик Яндекса “любит” вставлять разные операторы (в % относительно &):

&		100%
&/(-2 4)	8.813
&/(-1 3)	9.914
&/(1 1)		1.784
&/(0 0)		0.035
&&/(-7 7)	15.212
&&/(-3 3)	14.705
&&		6.714
!!%		0.035
! 		0.699

Длинные слова

По мотивам того, что у artlebedev на хомяке в тайтле есть слово экстраультрагиперпупервротебупермегасупернадежный и Яндекс с Рамблером его не находят (ноль результатов), хотя знают (статистика слов: 49). via Aik и itman.
Больше всего мне нравится коммент itman, а точнее третья версия -вторая часть:

Во-первых, некоторые поисковые машины игнорируют слова, которые есть только в тайтле. Во-вторых, они могут игнорировать слишком длинные тайтлы. В-третьих, они могут игнорировать слишком длинные слова. И тут могут быть варианты. То есть слово может обрезаться, а может и просто не индексироваться. Насколько я проверил, Яндекс слово не обрезает, хотя в закешированной текстовой версии слово есть, значит Яндекс новую версию странички сжевал.

-думаю, что Яндекс не ищет по длинным словам и не обрезает. Может, ему просто западло показывать эти длинные слова в поиске? Они длинные и неудобные… И, соотвественно, искать по ним неудобно. Пример:
по запросу студия артемия лебедева ваш && партнер показывается тайтл:

Студия Артемия Лебедева – ваш …

А по запросу поиска внутри сайта слова партнер показывается:

Студия Артемия Лебедева – … партнер

Т.е., слова до и после длинного яндекс знает, ему просто западло его в выдачу отгружать. При малейшем добавлении в запрос слов из тех, что ДО экстраультрагиперпупервротебупермегасупернадежный – конец обрезается многоточием.
UPD.
Рамблер тоже – слова не находит, но в выдаче показывает и болдом что надо выделяет:

Студия Артемия Лебедева — ваш экстраультрагиперпупервротебупермегасупернадежный партнер

“найденных слов” в онлайн в Яндексе больше не будет?

Обалдел, увидев вместо ссылки “найденные слова” в Яндексе ссылку “сохраненная копия”. Было ломанулся копировать дисковый кеш пробитых позиций по Яндексу… Но с ребятами посмотрели в урл ссылки – reqtext там еще есть… Насколько – неизвестно…
Но копию кеша все равно сделали. На всякий случай. 🙂
Но, видимо, в онлайне смотреть подсветку нам больше не дадуд.

число входящих ссылок на сайт

Вот рисунок по данным Яндекс-грантов 2004. Нарисовано “число сайтов в группе в зависимости от числа входящих ссылок на сайт” в логарифмических координатах. Т.е., группа хостов, имеющих 1 входящую ссылку, состоит из N1 хостов и т.д.

Довольно приличная линейность. Расколбас в области больших цитируемостей – из-за того, что мне было лениво выбирать представительные интервалы (от и до).
В среднем по больнице PR (нелогарифмированное значение) коррелирует с числом входящих ссылок на сайт.
Дальше: пилим этот треугольник по горизонтальной оси на 10 частей, и делаем ступеньки PageRank.

исследование

Сэр Тутубалин опубликовал исследование тИЦов и ПиАров в рунете.
Из всего этого следует вывод:

Высокий ТИЦ встречается в Рунете реже высокого PageRank, а значит высокий ТИЦ почетнее.

* коммент: вывод фантастический – люди уже обсасывают: “ТИЦ престижней PR”. Если в отдельно взятой москве N людей занимаются сексом, а N/1000 – художественным фистингом, то мы делаем вывод, что фистинг – “почетнее”. Поскольку его меньше.
хе-хе.

Что понравилось: средние значения тицов при различных пиарах. буду обращать внимание при покупке ссылок 🙂 Раньше я считал, что пиару 6 должен соответствовать тыц не меньше 2-3 тыс. А получается 750. Будем иметь в виду…