мой доклад на конфе выложен

14-го мой доклад на ашмановской конфе 2008, и презентация – выложены на bdbd.ru
Необычно как-то в пдфе. 🙂

‘Использование особенностей языка запросов поиска Яндекса для исследований’
Евгений Трофименко (начальник отдела исследований и аналитики, ‘Корпорация РБС’)
Яндекс – не только наиболее популярный поисковик в Рунете, но и наиболее открытый к исследованиям его алгоритмов. Рассмотрены особенности работы поиска по текстам ссылок, возможности для изучения трактовки Яндексом многозначных запросов и их расширения. Отдельные элементы переформулировки запросов Яндексом, полезные для оптимизации сайтов.

Основные пунктики:
1. отбор НПС-результатов [слово -слово”>
2. вычистка НПС, оценка доли НПС [запрос ~~абракадабра”>
3. исследование расширения запросов операторами исключения
4. отмена контекстных ограничений в новом колдунщике (точнее, колдунщика вообще нет больше)

API Яндекс.Карт

Яндекс.Карты апи запустили: http://api.yandex.ru/maps/
Сразу увидел прикольные слова:

Геокодер — сервис для определения координат географических объектов по их названиям или адресам.

Вроде в гугле такого не видел, хотя м.б. невнимательно читал, полюбому английский язык – зло, переводить и думать надо 🙂
Я как раз придумал, что по названиям Google maps тоже объекты выдает, и их можно парсить… А тут фича.

Тезисы мои у ашмановцев – неправильные :(

Официально заявляю, что тезисы моего доклада, опубликованные у ашманова на программе конференции – полное фуфло, я такого не писал (название доклада правильное, ‘Использование особенностей языка запросов поиска Яндекса для исследований’):

Конкурентность тематик в поисковой выдаче Google. Наличие поискового спама. Отличия алгоритма работы в англоязычном и русскоязычном сегменте.

Это все хрень собачья, я такого не писал. Не знаю, из какой жопы этот текст взялся.
Правильные тезисы звучат так:

Яндекс – не только наиболее популярный поисковик в рунете, но и наиболее открытый к исследованиям его алгоритмов. Рассмотрены особенности работы поиска по текстам ссылок, возможности для изучения трактовки Яндексом многозначных запросов и их расширения. Отдельные элементы переформулировки запросов Яндексом, полезные для оптимизации сайтов.

Откуда там вообще гугль взялся???

Как я это нашел: сегодня в ленте у sonja прочитал и сильно удивился..

И ведь это хрен знает сколько там висит…

PS Про гугль у меня ничего не будет, короче.
PPS Особенно радует "соответствие" названия доклада и тезисов. Там про яндекс, а тут вдруг про гугль.

Гугль индексирует сканированные PDF

Гугль пишет: http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html

Приведены примеры запросов, сканенные документы в выдаче:
http://www.google.com/search?q=public+statements+iraq
http://www.google.com/search?q=theory+of+interstellar+trade

Интересно, жырнее весит, чем обычный текст? Нагенерить дорвеи-то посложнее будет 🙂 Сейчас все начнут сайты сканированные делать 🙂

via