Блог Яндекса

http://company.yandex.ru/blog/ – узнал сразу отовсюду.
Кажется, это первый корпоративный блог в Рунете – такого масштаба.
Что молодцы – что сразу поднакопили несколько постов – чтобы было что читать, и что дают-таки в этих постах полезную информацию! 🙂
Что вы знаете про параллельные поиски? – я, честно говоря, почти ничего о них не знаю, даже термина не слышал, поэтому к утверждению:

Яндекс был первой или одной из первых поисковых систем, которая пришла к концепции параллельных поисков.
***
Решение с параллельными поисками, найденное Яндексом несколько лет назад, оказалось успешным, и сейчас к нему начали приходить крупные зарубежные поисковые системы

-неплохи были бы примеры. Конечно, Россия – родина слонов, это я согласен 🙂

Ссылки на табах на главной странице Яндекса — это не только ссылки, но и кнопки. Как это? Очень просто: достаточно ввести в поисковой строке запрос и кликнуть на названии соответствующей службы, чтобы поиск шел в ней, а не по вебу.

-надо же… Ну, тут либо ссылки, либо кнопки… Кто догадается о первом, не догадается о втором… Я, к примеру. догадался только – что если сначала набрать запрос и поискать, а потом кликнуть на ссылку в табах – то произойдет переход в нужный поиск… Т.е., про это я способен догадаться…

Ну а вообще – прикольно. Молодцы. Только интересно, Колмановская премодерирует эти посты или нет? А то мало ли… Вдруг кто ошибки допустит или чепуху какую брякнет… 🙂

Nigma – кластеризация запросов (точнее, ответов?)

Видел 2 упоминания о новом поисковике http://www.nigma.ru – я, правда, не очень понял – метапоиск это или чистая трансляция XML Яндекса (знаю, что сравнить выдачи можно, но лень :)).
Но вот основная фишка – кластеризация. Судя по всему, это именно кластеризация именно “ответов” на запросы (есть описание методов кластеризации) – как я понял, вся кластеризация происходит на основе выдачи, полученной от поисковиков.
Выглядит она, однако, очень прилично. Для конечного юзера прилично.
Умеет выделять из запроса принтеры группы лазерные принтеры, струйные принтеры, купить принтеры.
Из запроса реклама выделяет:

» размещение рекламы (23)
» интернет реклама (16)
» контекстная реклама (7)
» реклама в интернете (40)
» услуги (29)
» создание сайта (18)
» дизайн (17)
» продвижение сайта (15)
» раскрутка сайта (15)
» реклама на сайте (13)
» баннерная (15)
» контакты (18)
» страница (17)
» реклама интернете (7)
» газете (9)
» цены (14)
» маркетинг (11)
» журнале (7)
» разработка (13)
» реклама в прессе (7)
» о компании (12)
» разработка сайтов (6)
» web дизайн (5)

-вообще очень достойно. И понятно. Есть, конечно, левые вещи типа “страница”, но все-же… А вот из подраздела услуги выделило такой кластер, как “главная страница” 🙂
В общем, в этой кластеризации могут появляться и те слова, которых в запросе не было.
Еще бы как-то эту кластеризацию усечь… И можно прямо на Яндекс выкладывать. 🙂

о накрутках Яндекс-Директ

В форуме Директа – тема о накрутках – но не разных ссылок, а одной конкретной ссылки, вынутой со страницы с рекламой.
Действительно, забавно. Зачем же еще нужен номер сессии в урле рекламной ссылки, как не за тем, чтобы отсекать повторные клики? Яндекс не опровергает.
Ан нет. Яндекс учитывает повторные. Раздолье для скрутчиков 🙂

Анализатор позиций в поисковиках

… на perl, который я писал когда-то – обновил сейчас: анализатор позиций сайта в поисковиках.
Т.к. Рамблер поменял код выдачи. Еще бы, столько изменений – и Бегун, и “Рамблер – покупки” стали показываться.

Рамблер с Бегуном

Что-то много места реклама на Рамблере занимает… Запрос осушители воздуха – 3 объявления Бегуна – все вместе около 2/3 первого экрана занимает. Да еще у рамблера шрифт крупный…
Ишь, хитрецы – первую Бегуновскую ссылку болдом выделяют. Чтобы боролись за нее 🙂
У кого есть опыт размещения рекламы в Бегуне (на Рамблере) в последнее время? Как оно? В принципе, те же 22 цента за клик – дешево. Для размещения на Рамблере, а не на партнерских дорвеях. 🙂

С такими людьми коммунизма не построить…

По поводу создания поисковика. Направил меня товарищ, который собирался обеспечивать все железом и программерами – к программеру своему. На Сях.
Я программеру пишу что-то вроде теста:

Ну, пример. Надо организовать быстрый поиск (по точному соответствию слов) многословного запроса, с ограничением по расстоянию (в словах) между любой парой слов в 10 слов между ними. База – 100 млн. документов, средний размер документа (плейнтекст) – 20 Кб или 4000 слов. Результат – список документов.
Твои действия?

Ну и я думал что мне помощь какая-то будет. Я имею в виду, что человек знает, что такое обратный индекс… Но получаю в ответ:

1. Берем i-ый файл, открываем
2. Берем первое слово, ищем в файле -нашлось? да – ищем второе слово, проверяем дистанцию, совпало, тут добавляем в результаты запроса.
переходим к 1. если не совпало, то ищем третье слово, и проверяем дистанцию и так до 10.
если не нашлось дистанций меньше 10, то повторяем то же самое, однако мы как будто смещаемся, так как у нас, допустим слова “булка” может в тексте быть несколько штук.
3. если найдется, то добавляем в результаты(список).

-мдя, создание поисковика наталкивается на непреодолимые препятствия… 🙂

Yandex Spam Buster

Странно, обнаружил в логах такого робота, причем ходит с каких-то левых IP. Причем их меняет… Что бы это могло быть? Хотя ясно, что…
На сайте ничего вообще плохого нет…
Никто не замечал?

Тег index от Бегуна

А я-то и не заметил.
Но Cherny заметил: В семействе русских тегов прибавление

В теме замечаний по Автоконтексту Бегуна г-н Васин упомянул тег < index >, которым специально для системы автоконтекста выделяется смысловая часть документа

А я так думаю. Чем больше они напридумывают всякой чертовщины, тем лучше будут жить специалисты по этой чертовщине. 🙂

На рамблере замечены объявления Бегуна

by Professor: http://forum.searchengines.ru/showthread.php?s=&postid=821397
Кто кого купил, и так понятно. У Рамблера (холдинга) теперь аж 2 системы рекламы – одна совсем контекстная, одна наполовину.

PS Точно, если Бегун вдруг начнет размещать прямые ссылки, Яндекс ему спуску не даст. Дружба -дружбой, а табачок – врозь. 🙂

Яндекс: “неточное соответствие ссылки”

Яндекс довольно давно начал показывать товарные страницы моих магазинов по запросам, означающим категорию, например. По запросам, частично содержащемся в тексте ссылок на сайт (и, конечно, тайтлов и Hx).
Сегодня пробил еще раз и действительно – он делает это массово.
Даже по популярным запросам, означающим категорию, например, умудряется выпихнуть внутреннюю товарную страницу.