Сделал в апометре – отдельно по конкурентности

Сделал показ степени изменений при апдейтах, разбитую по запросам разной конкурентности.
В апометре (сегодня, внизу страницы) и в виджете (вид и ссылка для установки на яндекс) теперь графики степени изменения выдачи для нескольких групп запросов – от ВЧ конкурентных до никому не нужных.

В виджете только один график http://www.yandex.ru/?add=10156 , в апометре несколько – отдельно взвешенное изменение, отдельно невзвешенное. И в апометре еще степень изменения выдачи для разной длины запроса (число слов).

Надо теперь подумать, как удобнее показывать на сайте.

И да: обновляются эти картинки в 9-30, а не сразу после апа. Когда все 5К+ запросов скачаются из хмля.

Эти же данные доступны и при листании в глубину, они же давно собирались. Пролистав вглубь, видим, что иногда апдейты (как сегодня) бывают осмысленные, с явно более сильным изменением конкурентных запросов, а иногда бессмысленные (когда по всем запросам изменения примерно одинаковы). А иногда бывало даже – что по редким запросам изменения сильнее (я так думаю, это от подкруток учета текстового).

Причем там еще есть взвешенные изменения (когда глубокие пары учитываются с меньшим весом), и оно, например, сегодня не показывает осмысленных изменений ).

Ну и по длине запросов разные изменения бывают. Надо как-нть сесть, пролистать в глубину.
***
Пока что в день релиза не кажет графиков (когда текстовго апа нет), но сделаю.

___________________
UPD сделал показ в дни релизов.

+ пример, когда для низкочастотки сильнее расколбас
+ пример, когда только по длине запроса сильнее расколбас

конструкции поиска НПС больше нет в яндексе

Оператору для поиска удобных НПС в яндексе слово -слово пришел конец.

Заодно показали, что операторы поиска и примеры теперь новые. Двоеточий каких-то понаставили вместо знаков =. Наверное, какой-то любитель трубопаскаля теперь рулит, а = и кавычки удалил как пережиток прошлого )

Оператора "минус" там нет, но сам по себе он работает. Т.е., минус теперь применяется и к текстам ссылок.

Яндекс-адреса для всех независимо от тИЦ

Пришло письмо.
Однако к определению региона оно не относится – это только про адреса, и немного для гостиниц.
Для указания региона сайта – тиц все равно нужен.

Добрый день!

Закончилось бета-тестирование раздела “Адреса и организации” в сервисе Яндекс.Вебмастер, во время которого добавлять и редактировать данные об организации можно было лишь для сайтов с ТИЦ > 10. Теперь это можно сделать для сайтов с любым ТИЦ.

Кроме того, появилась возможность указать дополнительные данные об организации из наиболее популярных рубрик. Например, владелец гостиницы может сообщить количество номеров и расстояние до моря, а хозяин боулинга – количество дорожек, наличие детских шаров и караоке. Все эти данные будут показаны на карточке компании при поиске по Яндекс.Картам, а для сайтов гостиниц еще и в результатах поиска.

Более подробно о добавлении организаций можно почитать здесь: http://help.yandex.ru/webmaster/?id=1108685

почему они все такие – ч. 1

Вот.
Насчет алгоритмов и прочего обучения.
Поисковики такие поисковики. Они такие думают, что достаточно набрать побольше разных факторов, оценки асессоров насобирать, натравить обучалки.
Обучалки, жадные, всю эту кучу данных зохавают и родят Формулу. Чудесным Образом.
Но я как-то думаю, что чудесным образом ничего не родится. Вот вам из Гашека:

Однако мне тоже хочется, господа, задать вам одну загадку,— продолжал он.— Стоит четырехэтажный дом, в каждом этаже по восьми окон, на крыше — два слуховых окна и две трубы, в каждом этаже по два квартиранта. А теперь скажите, господа, в каком году умерла у швейцара бабушка?

Вот вам параметры, куча параметров. Окна, квартиранты, т.д. А теперь скажите, господа…
Так же и с яндексом. Вот вам число слов запроса на странице, нормированное и абсолютное, и в точных формах и неточных. И то же самое в ссылочном массиве. И то же по фразам – фразовые соотвествия, в контекстных ограничениях, и без ограничений. И т.д., до 250.
…И все это перемножить. ( 🙂 шариковское "и поделить")
…и зохавать в обучение.
…А теперь скажите господа, насколько релевантна страница запросу?
Результат в общем случае – непонятно какой. Естественно, часть параметров более-менее какой-то смысл имеет… Большая часть – никакого. Большая часть – непонятный смысл, типа а вдруг получится.
Ну так и выдача – тоже непонятно какая.
========
Общий мысль вот какой:
Дело не в обучалках. Дело в наборе факторов. Если у вас придуман прорывный, новый фактор (пример: пейджранк в свои годы), то его хоть в обучалку загнать, хоть просто в виде ручной формулы учитывать – толк будет. И хорошо искать будет.
А если ваши факторы – херня, то вся ваша королевская конница будет решать задачку выше – про бабушку. И искать будет типа так:

— Радий тяжелее олова?
— Я его, извиняюсь, не вешал,— со своей милой улыбкой ответил Швейк.
***
— Не знаете ли вы, какова наибольшая глубина в Тихом океане?
— Этого, извините, не знаю,— послышался ответ,— но думаю, что там наверняка будет глубже, чем под Вышеградской скалой на Влтаве.
***
— Сколько будет, если умножить двенадцать тысяч восемьсот девяносто семь на тринадцать тысяч восемьсот шестьдесят три?
— Семьсот двадцать девять,— не моргнув глазом, ответил Швейк.
— Я думаю, вполне достаточно,— сказал председатель комиссии. — Можете отвести обвиняемого на прежнее место.

Это я все к чему.
К тому, что нет тут никакого огромного "порога входа". Просто надо пробовать. Придумай хороший набор параметров – и будешь искать хорошо. Пусть даже новичок.
А то тов. Ашманов говорит – принесите 5-10 лямов, и сделаем поиск. Так тот поиск будет – как у всех. Как у рамблера, который самизнаетегде.
======
Высер еще не закончен, ждите продолжения

Собрал свою стату по last20

У меня пробивалка ласт20 на подозрительные запросы не только подозрительные пишет, но еще и обычные запросы собирает. Ну, оно уже давно стоит, хотя и с перебоями работает – вот решил собрать все запросы.

Итог:
всего запросов 68906463 (69 млн.)
уникальных запросов 28016725 (28 млн.)
всего фрагментов "одноклассник" 317673 (как в вордстате, по всем запросам. Для нормировки)
точных запросов "одноклассники" 117820

Конечно, там вычищено – порнухи и секса нет. Но зато коммерческие запросы есть. Этим будет отличаться от ливинтернетовских баз – там порнуха есть, но в коммерческих запросах должна быть дыра – сайты стату закрывают же.

Впору свою базу продавать ))

firefox с yahoo?

А яху, кажется, будет с поиском бинг. Мелкософт подкрался к файрфоксу 🙂
Все-таки странно. Не очень верится.
Опять же, что это еще за "Ubuntu Firefox"? Это файрфокс как у всех? Или какая-то модификация, никому не нужная?
Кажется, это ФФ для линуксоидов. Ну они 1. никому не нужны и 2. с гугла никуда не перейдут.

Ubuntu Firefox shuns Google for Yahoo! search

"The next release of Ubuntu will scrap Google as the default search engine on its Firefox browser in favor of Yahoo!, thanks to a new revenue-sharing deal between Yahoo! and commercial Ubuntu backer Canonical."

Ubuntu: Yahoo! заменит Google

По новому соглашению о разделе доходов между Yahoo! и компанией Canonical, коммерчески поддерживающей Убунту, в следующем релизе Убунту (10.4, Lucid Lynx) поисковая машина по умолчанию в браузере Firefox будет сменена с Google на Yahoo!

Cognitive продала Яндексу синтаксический анализатор

Cognitive продала Яндексу синтаксический анализатор
Интересно, какая основная цель – определение авторства (первоисточника) или борьбе с генеренными текстами (марков, синонимизаторы). Или извлечение фактов из текста?
Но я не очень верю, что получится что-то хорошее. Умных технологий можно придумать много, но на объемах текстов рунета они "не шмогут".
Значит, упрощения рулят. Надо про это почитать ))

Компания Cognitive Technologies объявляет о продаже (предоставление права использования за вознаграждение) компании «Яндекс» Программного Комплекса, включающего в себя возможности синтаксического анализа текста.

Синтаксический анализатор позволяет определить, какими синтаксическими отношениями связаны слова предложения. Это может звучать неожиданно, но для понимания текста эта информация гораздо важнее, чем значение отдельных слов. Потеря знаков препинания в классической фразе «казнить нельзя помиловать» приводит именно к потере однозначности синтаксических связей.

Использование синтаксического анализатора для больших корпусов текста позволяет определять и изучать статистические закономерности языка (встречаемость слов и конструкций). Такого рода закономерности могут быть использованы, в частности, при разрешении неоднозначностей (например «ключ упал на пол» и «в камнях забил ключ»), возникающих во время синтаксического разбора, а также при построении статистических моделей языка для распознавания слитной речи. Стоит отметить, что возможность разрешения неоднозначностей является одной из важнейших характеристик, отличающих лингвистические технологии разработанные Cognitive Technologies.

Применение синтаксического анализатора также позволяет проводить сравнение текстов на основе встречаемости в них различных слов и конструкций и разрабатывать методы понимания текстов, извлечения данных из текстов, а также другие приложения.

На основе данного программного комплекса компанией Cognitive Technologies создан ряд интеллектуальных программных продуктов, например системы определения авторства и стиля документа.

via

Какие нынче есть автопродвигалки?

Автоматические. Хочется их типа независимо протестировать.

Что я знаю:
1. Сеопульт
2. реинкарнация Реактора – rookii
3. Вебэффектор
4. на Мегаиндексе вроде автопродвигалка есть, письма шлют про нее
5. Маремото не считаем по двум причинам (одна из них – что он не со всеми запросами работает)

Еще какие-нибудь есть?

Релиз ненарисованный

у меня сегодня http://tools.promosite.ru/ шторм выдачи 42% без текстового апа.

Не заорало про релиз, потому что приучено на следующий день после апа не показывать, надо заново обучить (зато в виджете показывает, см.)

Но не только ашмановский апометр показал, но и сеоьюз написал, что типа что-то сообщили из источников. Про текстовое ранжирование.

Весь день представители поисковой системы не комментировали ситуацию, но сегодня выяснилось, что изменения объясняются обновлением части алгоритма, связанной с текстовым ранжированием. «Изменения могли повлиять на ранжирование страниц, содержащих тексты, предназначенные в первую очередь не для пользователей, а для влияния на поисковую систему», – уточнили в пресс-службе Яндекса.

Кстати, вчера перетрясло ладно – вчера еще текстовый апдейт был. Я-то про сегодня.

Блин, надо бы сегодня вывалить всем смотреть ежедневную анализировалку, но там в ней сложновато лазить )

Так в среднем – изменения более выражены по длинным запросам (степень изменения выдачи увеличивается от 20% для однословников до ~50% для 5-6 словных запросов), т.е. я верю в то, что расколбас коснулся текстового. Но и еще разного другого мог коснуться. )) Пойду втыкать дальше.

приехал с горных лыж

ездили со 2 января (сейчас вернулись) с горнолыжной школой сноупро в Кампителло, Италия.

катание – круто, куча трасс (суммарная длина трасс всего района 1200 км), в основном красные и черные.

Основная фишка – "sella ronda" – круговой маршрут вокруг горы, тоже длинный, часов 4-6 занимает (все это спуски плюс подъемники, в обе стороны проходится).

Скачиваю фотке, обошел дозором владенья – вроде разрушений нет, компьютеры железные обошлись без смазки. Вроде ничего не сломалось, если сломалось – ругайтесь в почту!

с меня фотке.