Илья Сегалович не под пытками

Интервью Ильи Сегаловича Вебпланете:
http://www.webplanet.ru/news/interview/2006/2/6/ilya_segalovich.html
Особо заинтересовало:

Сколько сейчас людей работает в «Яндексе»?
-Более трехсот.

-это каждое рыльце делает для компании чуть меньше миллиона уёв. 🙂 Если считать, что $250 млн – стоимость Яндекса.

Сейчас, судя по всему, самый крупный «xml-клиент» на выдачу — это Mail.Ru?
-Да.

-а ведь не пишут, как положено по термсам Я.ХМЛ, что “посик организован на основе Я.ХМЛ…”. Исключение типа.

Куда, по вашему, будут двигаться поисковые технологии? В какую сторону? В сторону персонализации? Или куда-то еще?
– *** Кроме того, по мере роста рентабельности поисковых систем, могут начать применяться более дорогие по ресурсам технологии.
***
— распознавание и учет типологии и структуры сайтов и страниц;
— обработка запроса на основе истории поискового поведения, как группового, так и, возможно, индивидуального;
— изучение динамики сети (для разных целей);
— обработка естественного языка.

-Типологии и структуры сайтов и страниц, что бы это могло быть… Структура – это если только на основе анализа таблиц (по идее, легко) определять, где колонка меню, где текст, где подвал… Динамика сети – чтобы ссылки не появлялись мгновенно кучей, trustrank?

Поиск по тегам — интересная и перспективная область, к сожалению, я не знаю пока сколь-нибудь крупного русского корпуса тегов, на который можно смотреть и экспериментировать.
***
Есть шанс, что теги окажутся инструментом будущих улучшений в поиске: например, как исходный материал для построения тезауруса, ортогонального, скажем, тому тезаурусу, который поисковые системы уже строят по поисковым запросам.

-есть шанс (около 100% :)), что с этим тезаурусом произойдет то же, что и с метатегами…

Вебальта и дорвеи – близнецы-братья ненадолго?

Содатели поисковика Вебальта страдают от дорвейщиков, ими же порожденных немного ранее:
http://umaxforum.com/topic/17/10065/0/
Смешно, молодцы! 🙂
PS и дальше в теме дорвейщики рассуждают о методах борьбы с самими собой 🙂