Положение о научных стипендиях Яндекса
http://company.yandex.ru/grant/index.xml , deadline: 31 октября 2004 года.
А вот здесь (приложение 1) описано, что Яндекс интересует:
- Автоматическая обработка текста, лингвистика
 
- Статистические и семантические методы текстового поиска применительно к вебу
 - Морфологические, синтаксические анализаторы
 - Снятие лексической, семантической неоднозначности
 - Нахождение и использование кросс-языковых ресурсов
 - Анализ поисковых запросов, сеансов и протоколов
 
- Построение и использование тезаурусов по пользовательским сеансам
 - Тематическая классификация запросов
 - Моделирование информационной потребности и поведения пользователя
 - Влияние сеанса и профиля пользователя на ранжирование
 - Статистическая и синтаксическая сегментация запроса, переформулирование запроса
 - Мультимедийный поиск
 
- Поиск изображений и музыки по содержанию
 - Кластеризация и классификация изображений
 - Оценка качества поиска
 
- Автоматические системы оценки качества поиска
 - Анализ поведения пользователей для оценки качества
 - Производительность и распределенные системы
 
- Эффективное исполнение запроса в распределенных системах: переформулирование запроса и выбор текстовых баз
 - Оптимизация, учитывающая ранжирование; частичные ответы
 - Анализ ссылок в вебе
 
- Меры популярности страниц, построенные на основе анализа ссылок
 - Обнаружение и анализ сообществ, их тематики, учет знания о сообществах в поиске
 - Обратная связь со стороны поисковых систем
 - Динамика появления и исчезновения ссылок, характеристики и модели веб-графа
 - Структура веб-сайтов и веб-страниц; полудубликаты
 
- Сегментация веб-страниц, выделение записей баз данных и данных, содержащихся в страницах, сгенерированных по шаблонам
 - Выявление структуры и функциональности веб-сайтов
 - Алгоритмы выявления дублей документов и «зеркал» сайтов; построение и использование сигнатур, устойчивых к небольшим изменениям документов
 - Автоматическая классификация веб-страниц и веб-сайтов
 
- Веб-каталог как учитель: классификация по зашумленным или неполным обучающим выборкам
 - Классификация с использованием гиперссылок
 - Построение и модификация тематических рубрикаторов на основе веб-корпуса
 - Анализ стиля
 
- Построение жанрового рубрикатора Веба; прослеживание эволюции традиционных и выявление новых функциональных стилей в Вебе
 - Жанровая классификация веб-текстов
 - Выявление положительных и отрицательных оценок в текстах
 - Выявление ангажированных и рекламных текстов
 - Автоматическая обработка новостей
 
- Разбиение потока новостных сообщений на событийные сюжеты
 - Построение иерархической структуры событийных сюжетов
 - Представление событийного сюжета: аннотирование, исправление фактических и стилистических ошибок в аннотациях
 - Устранение избыточности и дублирования в новостных сюжетах
 - Технология извлечения фактов для анализа новостей
 - Персонализация новостного потока
 - Рапространение информации в лентах СМИ и дневниках
 - Автоматическое аннотирование, отвечание на вопросы
 
- Составление аннотации для набора документов: аннотирование результата поиска, новостного сюжета, построение summary для сайта и т.п.
 - Аннотирование документов в зависимости от контекста: поискового запроса, жанра документа, пользовательского профиля и т.п.
 - Представление результата поиска: структурирование, аннотирование, отвечание на вопросы
 - Учет текстов ссылок при аннотировании документов, сайтов и результатов поиска
 - Рекомендующие системы и совместная фильтрация
 
- Анализ поведения пользователей интернет-магазинов, переходов пользователей
 - Совместный анализ предпочтений пользователей
 
А вот что Яндекс может для решения этих задач предоставить:
- Хост-граф Веба: ориентированный граф, вершинам которого соответствуют сайты (российского интернета), а ребрам – унифицированные ссылки между сайтами
 - Каталог Яндекса: структура и наполнение рубрикаторов (тематического, регионального и т.д.); url-адреса, заголовки и описания веб-ресурсов.
 - База Яндекс.Маркета: структура и наполнение товарных рубрик; описания товарных позиций, зашифрованные идентификаторы товарных позиций и продавцов
 - Репрезентативная выборка из нескольких сотен тысяч веб-страниц в виде заархивированных текстов и поискового индекса с программным интерфейсом к ним; информация о классификационных признаках этих веб-страниц, взятая из Яндекс.Каталога
 - Архивы протоколов запросов по различным поисковым источникам (Веб, Яндекс.Маркет и т.п.) с зашифрованными идентификаторами пользователей и статистикой результатов поиска; архивы протоколов переходов с результатов поиска по этим поисковым источникам
 - Выборка новостных сообщений от нескольких новостных агентств с указанием
 
дат и тематических категорий сообщений
-из списка мне лично пригодились бы первый и пятый пункты. Подать заявку, что ли? 🙂 Но, думаю, не интересуют их измышления таких людей, как я… 🙁