Из похода на Кавказ вернулся в пятницу, но инета не было. Походили хорошо, хотя дожди были. Снега много в этом году, поэтому многоие перевалы оказались легче рассчитанного. В результате полностью прошли маршрут, а он был составлен с большим перезакладом 🙂
Фотки после. Сейчас пойду читать ленту – накопилась куча непрочитанной фигни 🙂
Поэтому апометр буду чинить только теперь 🙂 Что-то там с количеством быстророботных документов, кажется – сильно большое оно, и при любом выпадении апометру кажется. что это ап 🙂
Из новостей, скачанных через телефон, удивила покупка Бегуна Гуглем. И Рамблер на продажу своей половины согласился. Не понимаю, как это ваще – продавать инструмент рекламы на самом себе? Может, признали поражение, слились?
Автор: Евгений Трофименко
А Яндекс-то поддался истерии с “одноклассниками”
Недавно смотрел список бодрых копий доменов на тему "одноклассников", и не заметил, что в списке доменов, оформленных на yandex, llc есть:
odnokursniki.ru
odnoshkolniki.ru
Ну, однокурсники еще туда-сюда, а одношкольники? 🙂
Сквоттят, сквоттят помаленьку.
Кстати, дарю идею фишерам: домен odnoklassmki.ru свободен (типа буква m вместо ni) 🙂
yahoo открывает API
via Alex Moskalyuk
Яху открыл для разработчиков программистскую платформу (?:)) под названием BOSS (Build your Own Search Service)
Поисковый отдел Yahoo! сегодня открыл свой индекс. Теперь пользователи платформы BOSS (Build Your Own Search Service) смогут отсылать поисковые запросы Yahoo!, получать назад результаты из индекса, самостоятельно производить ранжирование поисковых результатов, самостоятельно оформлять странуцы результатов поиска. Единственным условием является отображение рекламы Yahoo! Publisher Network на страницах с результатами, компания даже не лимитирует количество запросов.
На сегодняшний день открыты индексы для Web, картинок и новостей. Вроде как в ближайшие время планируются другие вертикали.
Русский поиск от Яху, конечно, говно, но ведь не только по русски можно искать 🙂 Хорошо, что можно самостоятельно ранжировать результаты – кажется, Яндекс.ХМЛ такое запрещал. Опять-же, число запросов неограничено.
Приведены штук пять примеров использования поиска.
Слава роботам 🙂
Апы, статсы гугла и др.
Такое впечатление, что скоро может получиться предсказывать апдейты (расколбасы, сбросы кеша) Яндекса. Второй случай расколбаса в некоторых данных вечером предыдущего дня… Ну, вернусь – посмотрим. Сейчас люди обсуждают, а выложенных документов не видно, что люди вроде и подтверждают, но у Иванова есть новые документы (хотя при перепроверке спонсора апдейта я вообще нового не нашел).
В субботу выезжаем в горы (Кавказ, Безенги), поход с Максом Назаровым, с которым я ходил в первый свой поход в 1997. Возвращаемся в начале августа, если что в сервисах умрет от отсутствия смазки – не удивляйтесь 🙂
Гугль начал примерные цифры в статистике Адвордз показывать, что ж – замена Рамблеру:
http://adwords.blogspot.com/2008/07/keyword-tool-updated-with-search-volume.html
http://forum.searchengines.ru/showthread.php?t=246725 .
Яндекс serverurl меняет?
Замечаю, что разные сайты из новых по-разному ищутся с serverurl-ом.
Например, пробиваю стандартным способом – из бара: http://yandex.ru/yandsearch?serverurl=www.yandex.ru – сайта не находит.
Добавляешь в аддурелку – нет, отвечает, не добавлю, ибо сайт проиндексирован. И ссылку дает вида: http://yandex.ru/yandsearch?serverurl=http://www.yandex.ru/ – по которой страницы сайта находятся.
Что-то у них там колбасится… может, с уровнями домена для серверурла химичат…
Мыло и Нигма, Я.карты, динамика цен Маркета
Оказывается, владелец доли в Мейлру решил прикупить себе еще немного поисковиков – кусочек Нигмы. "На эти деньги компания обещает запустить новый тип поиска — семантический, то есть понимающий смысл сформулированного по-русски запроса". Бессовестно врут имхо. 🙂 via
А вообще по-простому можно было бы такое сделать через поиск по "ответам". Типа человек отвечает за "понимание смысла", и классифицирует, а поисковик – за поиск по вопросам. Ну это как у Нейрона Андрея Иванова. А может, Нигма миллион китайцев наймет искать. 🙂
Яндекс выпустил карты, бета. Не нравится, что за пределами России не кажет схему. Мне, к примеру, Азия иногда актуальна. К примеру – озеро Алакёль на яндексе. А вот озеро Алакёль на Гуглемапсах. У гугля – даже деревья видны 🙂 Яндекс по сравнению – сосёт. Хотя и у Гугла не все гладко – бывают размытые куски 🙂 Но это же дело техники – авось наладят.
Еще мегаприкольная фича для магазинщиков – в Маркете. Графики средней цены. Я, правда, не понял – по выставленным ценам усредняется или по сделанным кликам на ссылки, что было бы реальнее. Еще по товарным группам бы такое видеть…
Яндекс "лижет у Тёмы" – уволил обосравшего того менеджера 🙂 Смешно вдвойне – увольнение за пост в блоге раз, за прогиб под Тёму два. Чувак в любом случае не пропадет – это ведь надо уметь так обосрать Тёму, чтобы тот обиделася и вообще заметил.
Всякое разное
Маул пеарит Линкфид, но странным образом: называя его дешевкой, и говоря, что типа есть две новости – одна хорошая, одна плохая. Плохая в том, что ссылки – гавно, а хорошая в том, что говна у нас – много 🙂 При этом по посту бодро раскиданы рефссылки. Даже жалко почему-то становится некоторых манимейкеров.
РСЯ начинает работать с физлицами напрямую за 45%, и “из начисленной суммы удерживает и перечисляет в бюджет РФ налог на доходы физических лиц (13%)”. Все радуются: в отличие от Гугля – она ж является налоговым агентом! 🙂 Прочитайте внимательно: “удерживает из начисленной суммы”. 🙂
Интересная фраза “Процент определенный по договору (45%) – это половина от стоимости размещения рекламы на сайте, за вычетом средних скидок и комиссий” – надо добыть скидки и их размеры, и прикинуть, сколько рекламодателей Яндекса “крупные”.
Магадан 2.0 – это уже боян. То накатят, то откатят…
В тулзе забавно виден процесс выкладывания базы Яндекса – за 24 сначала было ~20 сайтов, в след. час стало ~16 тыс., еще через час ~200 тыс. За 25 число похожим образом – постепенно выкладывают… Сделать, что ли, раз в минуту… Лениво.
Яндекс-видео запустилось.
Непонятный http://friends.rambler.ru/ появился…
Вы можете:
Читать в единой ленте сообщения своих друзей, опубликованные на разных сайтах
Узнавать о новых письмах из разных почтовых ящиков и сообщениях из социальных сетей
Видеть все свои записи, фотографии и видеоролики, размещенные на разных сайтах
-с “разных сайтов”? Типа яху пайпс будут тянуть данные, что ли? Не регался.
ХЗкто выёживается на сеошников, ну это понять просто – у него самого попросту не получается. Кстати, помнится, его студия раньше набирала сеошников и семинары проводили. Но не вышел каменный цветок. Некий Уякофф (имя-то какое!) отжигает в комментах на роеме. 🙂
Апдейт, которого по текстам не было…
…является изменением куска алгоритма.
Апдейт: тема тут.
Изменение выдачи видно:
http://www.web-it.ru/tools/seo/up/yandex/
http://pr-cy.ru/update/
Однако выкладывания проиндексированных текстов (=ссылок) не замечено:
http://tools.promosite.ru/updates/
http://ivanov.in/yandex-updates/
Интервью Садовского
…на Сеоньюсе. Сначала подумал, что сеоньюсовцы вопросы задавали, к середине понял, что из форума SE собирали…
Особо заинтересовало:
Здравствуйте. Скажите, пожалуйста, после смены алгоритма какие факторы влияют на ранжирование больше? Морды или статьи? Или, может, одинаково? Или что-то другое вообще? Ответьте, пожалуйста, чётко, без околотемных слов, то, что влияют ссылки, это итак понятно. Заранее благодарен.
Объясню (четко и без «околотемных слов»), почему не могу ответить на Ваш вопрос так, как Вы этого хотите.
Во-первых, влияние факторов меняется со временем, мы постоянно перенастраиваем формулу релевантности. В ранжировании используется машинное обучение на основе данных асессоров. Если, предположим, ссылки на большинство релевантных страниц исчезнут в небытие, ссылочные факторы после обучения алгоритма станут менее весомыми. И наоборот. Между большими изменениями программы («Магадан», «Находка» и т.д.) перенастройка может происходит многократно.Во-вторых, важно влияние не столько каждого отдельного фактора, сколько их сочетания, которое зависит от ответа (страницы, сайта и т.д.) В формуле ранжирования каждый фактор участвует не сам по себе, а в какой-то комбинации с другими факторами. Если, предположим, фактор А, основанный на ссылках, имеет большой вес, а фактор Б у страницы отсутствует, то, если в итоге машинного обучения для расчета релевантности А и Б оказались тесно связаны, бесполезно будет наращивать вес фактора А, не предприняв усилий в отношении Б. В-третьих, для ответа на Ваш вопрос придется детально рассказать именно о факторах. Ссылочный граф – это источник данных. Текст страницы – еще один. Таких типов данных совсем немного. Но из каждого из них можно извлечь много факторов, позволяющих оценить какой-то аспект релевантности. Наращивание ссылок может приводить одновременно к уменьшению одного ссылочного фактора и увеличению другого.
-все ж таки простой "формулой ранжирования" обойтись не получится… Получится табулированный набор коэффициентов для каждого дискретного "соотношения факторов".
В последнее время в выдаче по низко- и среднечастотным запросам стали появляться сайты, которые не содержат на странице вхождения ключевого запроса, а их Title в выдаче Яндексом формируется из текста внешней ссылки, которая стоит на этот сайт. По Вашему мнению, данный Title должен повышать привлекательность ресурса для пользователя или это нововведение сделано по каким-то другим причинам?
Мы не наблюдаем данное явление. Пришлите, пожалуйста, пример запроса и скриншот страницы с результатами поиска.
-отожгли оба, и вопрошающий, и Садовский. 🙂 Один "недавно начал замечать", а второй "не наблюдает данное явление". 🙂
Вопрошающий, наверное, забыл сказать, что у сайта в выдаче пустой тайтл. Я такую хрень видел в октябре 2005 и в феврале 2006 – если тайтла нет и сайт НПС, текст ссылки отображаетсявместо него.
Кстати, разыскивая страницы своего блога, очень удивился – яндекс знает 77 страниц, хотя постов там ~450. Сначала думал, глубже нескольких уровней – забывает страницы. Потом проверил – нашел ажно 4 страницы с постами. Жопа какая-то у них там.
Из ответа Садовского:
Ссылки классифицируются по множеству признаков, и оценка является вероятностной. Чем выше вероятность, что ссылка является SEO, тем меньше будет ее вес. Но если нет полной уверенности, поисковый алгоритм учитывает ссылки, хотя придает им небольшое значение.
-вероятности… Пейджранк – вероятность посещения, тут вероятности ссылки, аббревиатуры учитываютс с вероятностями… Вероятность того, что страница соответствует запросу. 🙂
Кстати, насчет вероятностей. Представим себе запрос типа "название товара". Вероятнее ли будет вероятность соответствия, если сайт – магазин? А как повысить вероятность того, что сайт – магазин? Словами "купить, корзина, заказ" и прочее. Не связанными с запросом. Надо обдумать.
Вы объявили, что Яндекс стал понимать транслитерацию в ссылках. Какой именно используется стандарт?
При транслитерации слова в название URL могут использоваться разные стандарты, поэтому при антранслитерации мы смотрим на несколько стандартов. Сгенерированные гипотезы оцениваем на правдоподобность и проверяем по словарю.
-Я чего-то не понял, про транслитерацию в урле или в тексте ссылки идет речь. В урле давно есть, а что, он об этом спецом объявлял? Да и в тексте ссылки давно есть. К чему это все?
Заметил, что при продвижении новых сайтов ссылки начинают не сразу работать на всю силу. Так ли это? Что нужно сделать, чтобы сайт не попал в "новичок"?
Мы учитываем в ранжировании далеко не все ссылки, которые находятся на проиндексированных страницах. Возможно, именно эта особенность алгоритма была интерпретирована Вами как отложенная «работа» ссылок.
-не все ссылки… вероятности…
Кого вы больше не любите: оптимизаторов или людей, торгующими ссылками. Есть ли у вас планы на Sape?
Людей я люблю, хотя результаты их деятельности мне не всегда по душе.
Планы на Sape? В народе говорят, готовь Sape с лета… 🙂
-Садовский как бы хочет сказать нам, что ссылки будут работать через полгода после установки 🙂
Как Яндекс относится к IDN доменам SU? Их индексация наравне с RU. Если использовать ключевик в названии домена, будет это учитываться при ранжировании?
Мы уже индексируем эти домены наравне с .ru. Ключевое слово пока не учитывается в ранжировании. Сейчас для таких доменов еще не работают операторы host, url и аналогичные, но скоро это будет исправлено.
-прикольно, насчет ключевиков в host="" 🙂
Как вы планируете улучшать алгоритм поиска? Собираетесь ли вводить новые технологии? Какие сервисы планируются в релиз на ближайшее время?
Мы постоянно вводим новые технологии и улучшаем алгоритмы. В ближайшем обновлении поисковой программы мы добавим новые факторы ранжирования, такие, как уникальность контента, классификатор порнографии, геоклассификатор запроса и многие другие.
-о как. Уникальные генеренные дорвеи будут рулить марковские 🙂
… и еще: почему вопрос Людкевича "когда будем пить" не попал в "вопоосы о будущем"? 😀
Про аббревиатуры и прилагательные в Яндексе
красиво, подробно расписывают…
Довольно много, 6-8% запросов:
Использование новых расширений слов запроса суммировано в следующей таблице:
Переход из одной части речи в другую — 17182 пар слов, 6% запросов
Транслитерация — 25455 пар слов, 8% запросов
Аббревиатуры — 19360 пар слов, 1,5% запросов
Интересный "переход из одной части речи в другую":
московские работа
московские знакомства
московская продажа
– везде слово "москва" выделено и учтено. А в московские окна – не выделено 🙂