Яндекс serverurl меняет?

Замечаю, что разные сайты из новых по-разному ищутся с serverurl-ом.
Например, пробиваю стандартным способом – из бара: http://yandex.ru/yandsearch?serverurl=www.yandex.ru – сайта не находит.
Добавляешь в аддурелку – нет, отвечает, не добавлю, ибо сайт проиндексирован. И ссылку дает вида: http://yandex.ru/yandsearch?serverurl=http://www.yandex.ru/ – по которой страницы сайта находятся.

Что-то у них там колбасится… может, с уровнями домена для серверурла химичат…

Мыло и Нигма, Я.карты, динамика цен Маркета

Оказывается, владелец доли в Мейлру решил прикупить себе еще немного поисковиков – кусочек Нигмы. "На эти деньги компания обещает запустить новый тип поиска — семантический, то есть понимающий смысл сформулированного по-русски запроса". Бессовестно врут имхо. 🙂 via
А вообще по-простому можно было бы такое сделать через поиск по "ответам". Типа человек отвечает за "понимание смысла", и классифицирует, а поисковик – за поиск по вопросам. Ну это как у Нейрона Андрея Иванова. А может, Нигма миллион китайцев наймет искать. 🙂

Яндекс выпустил карты, бета. Не нравится, что за пределами России не кажет схему. Мне, к примеру, Азия иногда актуальна. К примеру – озеро Алакёль на яндексе. А вот озеро Алакёль на Гуглемапсах. У гугля – даже деревья видны 🙂 Яндекс по сравнению – сосёт. Хотя и у Гугла не все гладко – бывают размытые куски 🙂 Но это же дело техники – авось наладят.

Еще мегаприкольная фича для магазинщиков – в Маркете. Графики средней цены. Я, правда, не понял – по выставленным ценам усредняется или по сделанным кликам на ссылки, что было бы реальнее. Еще по товарным группам бы такое видеть…

Яндекс "лижет у Тёмы" – уволил обосравшего того менеджера 🙂 Смешно вдвойне – увольнение за пост в блоге раз, за прогиб под Тёму два. Чувак в любом случае не пропадет – это ведь надо уметь так обосрать Тёму, чтобы тот обиделася и вообще заметил.

Всякое разное

Маул пеарит Линкфид, но странным образом: называя его дешевкой, и говоря, что типа есть две новости – одна хорошая, одна плохая. Плохая в том, что ссылки – гавно, а хорошая в том, что говна у нас – много 🙂 При этом по посту бодро раскиданы рефссылки. Даже жалко почему-то становится некоторых манимейкеров.

РСЯ начинает работать с физлицами напрямую за 45%, и “из начисленной суммы удерживает и перечисляет в бюджет РФ налог на доходы физических лиц (13%)”. Все радуются: в отличие от Гугля – она ж является налоговым агентом! 🙂 Прочитайте внимательно: “удерживает из начисленной суммы”. 🙂
Интересная фраза “Процент определенный по договору (45%) – это половина от стоимости размещения рекламы на сайте, за вычетом средних скидок и комиссий” – надо добыть скидки и их размеры, и прикинуть, сколько рекламодателей Яндекса “крупные”.

Магадан 2.0 – это уже боян. То накатят, то откатят…

В тулзе забавно виден процесс выкладывания базы Яндекса – за 24 сначала было ~20 сайтов, в след. час стало ~16 тыс., еще через час ~200 тыс. За 25 число похожим образом – постепенно выкладывают… Сделать, что ли, раз в минуту… Лениво.

Яндекс-видео запустилось.

Непонятный http://friends.rambler.ru/ появился…

Вы можете:

Читать в единой ленте сообщения своих друзей, опубликованные на разных сайтах

Узнавать о новых письмах из разных почтовых ящиков и сообщениях из социальных сетей

Видеть все свои записи, фотографии и видеоролики, размещенные на разных сайтах

-с “разных сайтов”? Типа яху пайпс будут тянуть данные, что ли? Не регался.

ХЗкто выёживается на сеошников, ну это понять просто – у него самого попросту не получается. Кстати, помнится, его студия раньше набирала сеошников и семинары проводили. Но не вышел каменный цветок. Некий Уякофф (имя-то какое!) отжигает в комментах на роеме. 🙂

Апдейт, которого по текстам не было…

…является изменением куска алгоритма.
Апдейт: тема тут.
Изменение выдачи видно:
http://www.web-it.ru/tools/seo/up/yandex/
http://pr-cy.ru/update/
Однако выкладывания проиндексированных текстов (=ссылок) не замечено:
http://tools.promosite.ru/updates/
http://ivanov.in/yandex-updates/

Интервью Садовского

…на Сеоньюсе. Сначала подумал, что сеоньюсовцы вопросы задавали, к середине понял, что из форума SE собирали…
Особо заинтересовало:

Здравствуйте. Скажите, пожалуйста, после смены алгоритма какие факторы влияют на ранжирование больше? Морды или статьи? Или, может, одинаково? Или что-то другое вообще? Ответьте, пожалуйста, чётко, без околотемных слов, то, что влияют ссылки, это итак понятно. Заранее благодарен.

Объясню (четко и без «околотемных слов»), почему не могу ответить на Ваш вопрос так, как Вы этого хотите.
Во-первых, влияние факторов меняется со временем, мы постоянно перенастраиваем формулу релевантности. В ранжировании используется машинное обучение на основе данных асессоров. Если, предположим, ссылки на большинство релевантных страниц исчезнут в небытие, ссылочные факторы после обучения алгоритма станут менее весомыми. И наоборот. Между большими изменениями программы («Магадан», «Находка» и т.д.) перенастройка может происходит многократно.

Во-вторых, важно влияние не столько каждого отдельного фактора, сколько их сочетания, которое зависит от ответа (страницы, сайта и т.д.) В формуле ранжирования каждый фактор участвует не сам по себе, а в какой-то комбинации с другими факторами. Если, предположим, фактор А, основанный на ссылках, имеет большой вес, а фактор Б у страницы отсутствует, то, если в итоге машинного обучения для расчета релевантности А и Б оказались тесно связаны, бесполезно будет наращивать вес фактора А, не предприняв усилий в отношении Б. В-третьих, для ответа на Ваш вопрос придется детально рассказать именно о факторах. Ссылочный граф – это источник данных. Текст страницы – еще один. Таких типов данных совсем немного. Но из каждого из них можно извлечь много факторов, позволяющих оценить какой-то аспект релевантности. Наращивание ссылок может приводить одновременно к уменьшению одного ссылочного фактора и увеличению другого.

-все ж таки простой "формулой ранжирования" обойтись не получится… Получится табулированный набор коэффициентов для каждого дискретного "соотношения факторов".

В последнее время в выдаче по низко- и среднечастотным запросам стали появляться сайты, которые не содержат на странице вхождения ключевого запроса, а их Title в выдаче Яндексом формируется из текста внешней ссылки, которая стоит на этот сайт. По Вашему мнению, данный Title должен повышать привлекательность ресурса для пользователя или это нововведение сделано по каким-то другим причинам?
Мы не наблюдаем данное явление. Пришлите, пожалуйста, пример запроса и скриншот страницы с результатами поиска.

-отожгли оба, и вопрошающий, и Садовский. 🙂 Один "недавно начал замечать", а второй "не наблюдает данное явление". 🙂
Вопрошающий, наверное, забыл сказать, что у сайта в выдаче пустой тайтл. Я такую хрень видел в октябре 2005 и в феврале 2006 – если тайтла нет и сайт НПС, текст ссылки отображаетсявместо него.
Кстати, разыскивая страницы своего блога, очень удивился – яндекс знает 77 страниц, хотя постов там ~450. Сначала думал, глубже нескольких уровней – забывает страницы. Потом проверил – нашел ажно 4 страницы с постами. Жопа какая-то у них там.

Из ответа Садовского:

Ссылки классифицируются по множеству признаков, и оценка является вероятностной. Чем выше вероятность, что ссылка является SEO, тем меньше будет ее вес. Но если нет полной уверенности, поисковый алгоритм учитывает ссылки, хотя придает им небольшое значение.

-вероятности… Пейджранк – вероятность посещения, тут вероятности ссылки, аббревиатуры учитываютс с вероятностями… Вероятность того, что страница соответствует запросу. 🙂
Кстати, насчет вероятностей. Представим себе запрос типа "название товара". Вероятнее ли будет вероятность соответствия, если сайт – магазин? А как повысить вероятность того, что сайт – магазин? Словами "купить, корзина, заказ" и прочее. Не связанными с запросом. Надо обдумать.

Вы объявили, что Яндекс стал понимать транслитерацию в ссылках. Какой именно используется стандарт?
При транслитерации слова в название URL могут использоваться разные стандарты, поэтому при антранслитерации мы смотрим на несколько стандартов. Сгенерированные гипотезы оцениваем на правдоподобность и проверяем по словарю.

-Я чего-то не понял, про транслитерацию в урле или в тексте ссылки идет речь. В урле давно есть, а что, он об этом спецом объявлял? Да и в тексте ссылки давно есть. К чему это все?

Заметил, что при продвижении новых сайтов ссылки начинают не сразу работать на всю силу. Так ли это? Что нужно сделать, чтобы сайт не попал в "новичок"?
Мы учитываем в ранжировании далеко не все ссылки, которые находятся на проиндексированных страницах. Возможно, именно эта особенность алгоритма была интерпретирована Вами как отложенная «работа» ссылок.

-не все ссылки… вероятности…

Кого вы больше не любите: оптимизаторов или людей, торгующими ссылками. Есть ли у вас планы на Sape?
Людей я люблю, хотя результаты их деятельности мне не всегда по душе.
Планы на Sape? В народе говорят, готовь Sape с лета… 🙂

-Садовский как бы хочет сказать нам, что ссылки будут работать через полгода после установки 🙂

Как Яндекс относится к IDN доменам SU? Их индексация наравне с RU. Если использовать ключевик в названии домена, будет это учитываться при ранжировании?
Мы уже индексируем эти домены наравне с .ru. Ключевое слово пока не учитывается в ранжировании. Сейчас для таких доменов еще не работают операторы host, url и аналогичные, но скоро это будет исправлено.

-прикольно, насчет ключевиков в host="" 🙂

Как вы планируете улучшать алгоритм поиска? Собираетесь ли вводить новые технологии? Какие сервисы планируются в релиз на ближайшее время?
Мы постоянно вводим новые технологии и улучшаем алгоритмы. В ближайшем обновлении поисковой программы мы добавим новые факторы ранжирования, такие, как уникальность контента, классификатор порнографии, геоклассификатор запроса и многие другие.

-о как. Уникальные генеренные дорвеи будут рулить марковские 🙂

… и еще: почему вопрос Людкевича "когда будем пить" не попал в "вопоосы о будущем"? 😀

Про аббревиатуры и прилагательные в Яндексе

красиво, подробно расписывают…

Довольно много, 6-8% запросов:

Использование новых расширений слов запроса суммировано в следующей таблице:

Переход из одной части речи в другую — 17182 пар слов, 6% запросов
Транслитерация — 25455 пар слов, 8% запросов
Аббревиатуры — 19360 пар слов, 1,5% запросов

Интересный "переход из одной части речи в другую":

московские работа
московские знакомства
московская продажа
– везде слово "москва" выделено и учтено. А в московские окна – не выделено 🙂

яндекс показывает кириллические домены

тема форума.

Пример: "окна su":

http://xn—-7sbbgpqmf1aiqn6k.su/
найден по ссылке: красивые-окна.su…
красивые-окна.su
http://xn—-7sbbgobsawdlngm6qpb.su/
найден по ссылке: алюминиевые-окна.su…
алюминиевые-окна.su
http://xn—-7sbbgpqodc1agde4ap2m.su/
найден по ссылке: пластиковые-окна.su…
пластиковые-окна.su

Однако по ссылке на кириллический урл (пример: url="пластиковые-окна.su") сайты не находятся.

Гугель, кстати, раньше начал находить IDN домены.

PS Я тоже считаю, что кириллические домены – говно, а тем более в зоне SU. Ни одного не купил. Я вообще считаю, что наш КЦ (координационный центр) нас наёбывает нипадеццки… Взять хотя бы бывшую эпопею – с "транслитными дублями" доменов, типа собирались ввести кириллицу в РУ и их собирались "приоритетно регистровать" на владельцев транслитных дублей. Куча народу повелась, и тов. Денискин по туризму…

Я-то ладно – 1. опоздал к раздаче и 2. очень хорошо, что опоздал, зарегал штук 10-15 транслита.

А ведь иные люди (jsc "russobalt") попали на кучу транслитных доменов.

Так что нашим мудакам я не верю принципиально.

Домены с олимпийскими названиями будут отбирать?

Нет, я слышал, что в Сочах передел недвижимости был… Получается, и до доменов докатилось?
Вот люди жалуются: http://forum.searchengines.ru/showthread.php?t=238026

Итак, вот информация с официального сайта Сочи-2014:

В соответствии с Федеральным законом № 310-ФЗ от 01.12.07 к Олимпийской и Паралимпийской символике относятся:
Наименования «Олимпийский», «Олимпиада», «Сочи 2014», «Olympic», «Olympian», «Olympiad», «Olympic Winter Games», «Olympic Games», «Sochi 2014» (и образованные на их основе слова и словосочетания)

http://sochi2014.com/34359

Исключительное право на товарный знак может быть осуществлено для индивидуализации товаров, работ или услуг, в отношении которых товарный знак зарегистрирован (в соответствии с классами Международной классификации товаров и услуг, что обязательно указывается в свидетельстве на товарный знак), в частности путем размещения товарного знака:

5. в сети Интернет, в том числе в доменном имени и при других способах адресации.

http://sochi2014.com/32366

И сразу хочу ответить на вопрос о том, будут ли преследовать. Ответ будут!
Сегодня мне позвонили на сотовый из ОргКомитета игр:
(ОК)- Вы администратор домена sochi-2014.biz?
(я) – да
(ОК) – настоятельно рекомендует прекратить незаконное использование олимпийской символики, в противном случае это будет сделано через суд.

Далее менее содеражтельная часть разговора.
Думал меня развели – но когда забил номер телефона в Яндексе – офигел!
+7 (495) 739 46 49 – http://sochi2014.com/sch_contacts_ru

Так, что большенству из http://forum.searchengines.ru/showthread.php?t=150407 придется сайты закрывать…

Хотя вообще закон про ТМ вроде говорит, что если название, сходное с ТМ, использовалось ДО регистрации ТМ, то его можно продолжать использовать “в том же объеме”. Что тут считать датой регистрации… Дату принятия закона, что ли?

Мастерхост – уроды… Который раз…

Взяли и сменили путь к php-скриптам 23 мая… Из-за этого cron перестал работать…
И не предупредили, конечно… зато регулярно их девачки звонят "нет ли проблем с оплатой"…

Причем даже в доке своей накосячили – написали путь /usr/local/apache-php4/bin/php-cli, а он вовсе и другой – /usr/local/php4/bin/php-cli, по аналогии с php5 подобрал…

Ненавижу….

Прямая ссылка: уроды, кретины, козлы… 🙂

XSS запросы – их виды

Нет, понятно, что тема XSS в плане тИЦ умерла, но людям зачем-то это еще надо… Парсят.

На знакомый сайтик, где самодельный счетчик стоит и берет рефререр из яваскрипта как document.referrer, присылают интересные переменные вместо этого рефререра:

1
'
"
'
X S
<>
--
2-1 and 1=1
2 and 1=1
' and '1'='2
" and "1"="1
" and "1"="2
XSS@<xscript>XSS</xscript>.com
XSS@%3cxscript%3eXSS%3c%2fxscript%3e.com
java:xscript(XSS)
myvalue" myattribute="java:xscript(XSS)"
myvalue myattribute=java:xscript(XSS)
myvalue' myattribute='java:xscript(XSS)'
XSS@+xscript-XSS+/xscript-.com
><!--
'><!--
"><!--
\n\nPTHeader: PTValue
/boot.ini
../../../../../../../../../boot.ini
/windows/win.ini
../../../../../../../../../windows/win.ini
/filename.php
/filename.php.
/filename.php
filename.php
filename.php.
filename.php
|id|
`id`
;id;

-(где filename – файл скрипта счетчика).
Мне многое незнакомо (особенно проверка на винды, ведь на сервере не винды), но все же интересно.
Что означают \n\nPTHeader: PTValue? И вот это все: XSS@<xscript>XSS</xscript>.com

Если кто в теме, просветите плз.