Показ тИЦ и “пальцев”

Перетащите на панель ссылок в броузере вот эти ссылки, и при клике оно покажет рядом с каждой ссылкой на другой домен для этого домена:
Показ кнопки тИЦа: 0) {linkdomain=document.links[i].href.substring(7,document.links[i].href.indexOf(‘/’,8)); if (linkdomain!=thisdomain && linkdomain.indexOf(nowww)==-1 && linkdomain!=’hghltd.yandex.com’) { document.links[i].outerHTML+=’‘;};}; }; void(0)”>W

(Метод собезьянничал у Professor’a)

Я делаю сабмиттер в каталоги. И скоро открою!

Типа ура и наконец-то.
История такая. Захотел я сделать сабмиттер в каталоги, который бы подставлял данные юзера в форму. И собирал бы потихоньку данные для будущего автосабмита (какие имена какой смсыл имеют, и какие есть категории).
И сделал его на perl в виде “прокладки” между человеком и сайтом каталога.
Но тут возникли сложности:
Во-первых, хтмл код люди пишут ну настолько косо, что даже человек не поймет. Даже иногда имена переменных не пишут!
Во-вторых, большая проблема была – надо переколбасить все ссылки так, чтобы они указывали на нужные страницы “через меня”.
В-третьих, почему-то скрипт не хотел иногда заполнять поля и даже глотал непредсказуемым образом куски кода… Думал-думал, не придумал.
В-четвертых, сабмит с одного IP – потенциально могут отрубить.
Короче, выложил его на http://submitter.promosite.ru/ Регистрироваться (и тем более платить) не надо, смотрите демки.
Но вот возникли более правильные мысли. Делать разбор полей яваскриптом и отказаться от идеи “серверной прокладки”. И вот, о чудо! Все работает.
Почти.
Короче, недельки через 2 сделаю все полностью. И на некоторое время (пару месяцев) открою в свободный полнофункциональный доступ – базу-то надо обучить… 🙂
Может, есть мнения, -сколько может вся эта радость стоить в денежном выражении по по уму. И на сколько месяцев ее стоит открыть на начальный период.

Тег textarea в Яндексе

Древнее – предревнее наблюдение: при поисках по различным словам в Яндексе очень часто вываливались страницы “форумов” by Matt Wright, но не страницы с текстом, с страницы “для ответа”, которые отличались практически только тем, что весь текст засобачен в тег < textarea >.
Отсюда делался вывод, что этот тег дает плюс в релевантности.
***
Сейчас смотрел, и оказалось, не прошли еще те времена. По запросу В компании Рамблер, которую я представляю, сейчас открылось несколько вакансий web-программистов первой вылезает страница с ответом, цитирующая все в textarea, вместо страницы сообщения.
А в Рамблере такого найти не удалось. Сессии, видно, не понравились Рамблеру.

Rambler is watching You!

Суть: люди из Рамблера следят персонально за оптимизаторами. Но смотрят как-то немного криво, хотя лучше от этого не становится.
Подробно:
Живет у меня сайт про ноутбуки. Чувствует себя вроде неплохо. Там три субдомена, один из которых – новостной. Проиндексированы Рамблером были вроде, ну там, как обычно поначалу – какое-то копьё по посещаемости с Рамблера было (счетчика не крутили).
Тут вижу – оппаньки, а основной домен и еще один – из Рамблера выкинуты (оба имеют коммерческую направленность), а новостной субдомен – живет нормально, даже подрос чуток.
Пишу в форму. Мол, непонятно, однако. Ответа нет.
Пишу через недельку на [email protected] . Типа, не понимаю, ничего не нарушал.
Мне в ответ приходит буквально следующее:

Мы категорически против экспериментов, проводимых над поисковой
машиной, приводящих к ухудшению качества индекса и адекватности
ранжирования результатов поиска( см.
http://blog.promosite.ru/comments.php?68 ).

Мы не сможем нормально ранжировать сайты, использующие спамерские
методы оптимизации.


C уважением,
служба технической поддержки Rambler

Что в общем, лестно, но неприятно. Читают – то читают, но ежу ведь ясно, что эксперимент был вывален на другой домен. И там же был благополучно прибанен Рамблером (и Яндексом).
А этот сайт – видишь как, наказали. Ударим, так сказать, долларом. Если ничем другим не можем.
Типа по-русски: разберемся как следует и накажем, кого попало. 🙂
Я в ответ предложил список сайтов послать – пусть все забанят тогда. Если кто хочет в этот список сайты своих конкурентов включить – пишите, я не жадный, поделюсь. 🙂
Ну, и называется – веди блог после этого.
Думайте…
А вот данные по посещениям этого блога:

81.19.65.50 Mozilla/5.0 (compatible; Konqueror/3.2; FreeBSD) (KHTML, like Gecko)
81.19.65.204 Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0; T312461)
81.19.65.127 Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)

Вот с каких данных пришло письмо:

Received: from [81.19.64.101] (helo=park.rambler.ru)
Received: from Marinas.rambler.stack.net (marinas.rambler.stack.net [81.19.65.204])

Бот Рамблера ходил на блог с 81.19.66.9 и 81.19.66.6, сетка 81.19.64.0 – 81.19.66.255
Rambler is watching You…

Яндекс вслед за Google – научные стипендии

Положение о научных стипендиях Яндекса

http://company.yandex.ru/grant/index.xml , deadline: 31 октября 2004 года.
А вот здесь (приложение 1) описано, что Яндекс интересует:

  1. Автоматическая обработка текста, лингвистика
    • Статистические и семантические методы текстового поиска применительно к вебу
    • Морфологические, синтаксические анализаторы
    • Снятие лексической, семантической неоднозначности
    • Нахождение и использование кросс-языковых ресурсов
  2. Анализ поисковых запросов, сеансов и протоколов
    • Построение и использование тезаурусов по пользовательским сеансам
    • Тематическая классификация запросов
    • Моделирование информационной потребности и поведения пользователя
    • Влияние сеанса и профиля пользователя на ранжирование
    • Статистическая и синтаксическая сегментация запроса, переформулирование запроса
  3. Мультимедийный поиск

    • Поиск изображений и музыки по содержанию
    • Кластеризация и классификация изображений
  4. Оценка качества поиска
    • Автоматические системы оценки качества поиска
    • Анализ поведения пользователей для оценки качества
  5. Производительность и распределенные системы

    • Эффективное исполнение запроса в распределенных системах: переформулирование запроса и выбор текстовых баз
    • Оптимизация, учитывающая ранжирование; частичные ответы
  6. Анализ ссылок в вебе

    • Меры популярности страниц, построенные на основе анализа ссылок
    • Обнаружение и анализ сообществ, их тематики, учет знания о сообществах в поиске
    • Обратная связь со стороны поисковых систем
    • Динамика появления и исчезновения ссылок, характеристики и модели веб-графа
  7. Структура веб-сайтов и веб-страниц; полудубликаты
    • Сегментация веб-страниц, выделение записей баз данных и данных, содержащихся в страницах, сгенерированных по шаблонам
    • Выявление структуры и функциональности веб-сайтов
    • Алгоритмы выявления дублей документов и «зеркал» сайтов; построение и использование сигнатур, устойчивых к небольшим изменениям документов
  8. Автоматическая классификация веб-страниц и веб-сайтов
    • Веб-каталог как учитель: классификация по зашумленным или неполным обучающим выборкам
    • Классификация с использованием гиперссылок
    • Построение и модификация тематических рубрикаторов на основе веб-корпуса
  9. Анализ стиля
    • Построение жанрового рубрикатора Веба; прослеживание эволюции традиционных и выявление новых функциональных стилей в Вебе
    • Жанровая классификация веб-текстов
    • Выявление положительных и отрицательных оценок в текстах
    • Выявление ангажированных и рекламных текстов
  10. Автоматическая обработка новостей

    • Разбиение потока новостных сообщений на событийные сюжеты
    • Построение иерархической структуры событийных сюжетов
    • Представление событийного сюжета: аннотирование, исправление фактических и стилистических ошибок в аннотациях
    • Устранение избыточности и дублирования в новостных сюжетах
    • Технология извлечения фактов для анализа новостей
    • Персонализация новостного потока
    • Рапространение информации в лентах СМИ и дневниках
  11. Автоматическое аннотирование, отвечание на вопросы

    • Составление аннотации для набора документов: аннотирование результата поиска, новостного сюжета, построение summary для сайта и т.п.
    • Аннотирование документов в зависимости от контекста: поискового запроса, жанра документа, пользовательского профиля и т.п.
    • Представление результата поиска: структурирование, аннотирование, отвечание на вопросы
    • Учет текстов ссылок при аннотировании документов, сайтов и результатов поиска
  12. Рекомендующие системы и совместная фильтрация
    • Анализ поведения пользователей интернет-магазинов, переходов пользователей
    • Совместный анализ предпочтений пользователей

А вот что Яндекс может для решения этих задач предоставить:

  1. Хост-граф Веба: ориентированный граф, вершинам которого соответствуют сайты (российского интернета), а ребрам – унифицированные ссылки между сайтами
  2. Каталог Яндекса: структура и наполнение рубрикаторов (тематического, регионального и т.д.); url-адреса, заголовки и описания веб-ресурсов.
  3. База Яндекс.Маркета: структура и наполнение товарных рубрик; описания товарных позиций, зашифрованные идентификаторы товарных позиций и продавцов
  4. Репрезентативная выборка из нескольких сотен тысяч веб-страниц в виде заархивированных текстов и поискового индекса с программным интерфейсом к ним; информация о классификационных признаках этих веб-страниц, взятая из Яндекс.Каталога
  5. Архивы протоколов запросов по различным поисковым источникам (Веб, Яндекс.Маркет и т.п.) с зашифрованными идентификаторами пользователей и статистикой результатов поиска; архивы протоколов переходов с результатов поиска по этим поисковым источникам
  6. Выборка новостных сообщений от нескольких новостных агентств с указанием
    дат и тематических категорий сообщений

-из списка мне лично пригодились бы первый и пятый пункты. Подать заявку, что ли? 🙂 Но, думаю, не интересуют их измышления таких людей, как я… 🙁

Надумал-таки способ определять ‘самое главное’ зеркало сайта

Итак, если сайт с зеркалом зарегистрирован в Яндекс-каталоге, один из доменов отвалился, то будет показываться “неглавное” зеркало.
Как определить, какое главное и стоит ли покупать освобожденное?
Предположение: когда оба зеркала доступны, в ЯК показывается главное зеркало. Осталось взять где-нибудь кеш страницы ЯК. Взять его можно в Гугле.
Примеры.
1) Завтра освобождается домен positive-pr.ru, который сейчас зеркало positivepr.ru. Какое главное? Ищем в Гугле site:yaca.yandex.ru positive-pr.ru – пусто! Ищем тогда site:yaca.yandex.ru positivepr.ru – находим страницу ЯК yaca.yandex.ru/yca/cat/Business/Marketing_and_Advertising/24.html, в кеше Гугля которой находится тот самый сайт с тИЦом 90, данные от 21 февраля.
2) Завтра освобождается домен blatata.ru с тИЦом 400, зеркало blatata.com, на сайт ведут 157 ссылок из суммарных 300. Какое главное? Ищем site:yaca.yandex.ru blatata.ru – находим искомое в двух категориях ЯК от февраля. Вывод – люди бросили главное зеркало. То же ищем в Ггуле для blatata.com – нету его.
Вот и способ.
Кстати, если цитируемость большая и сайт высоко по иерархии – то может ведь и переиндексироваться та самая страница ЯК. Тогда надо по названию искать.

Зеркала в Я.Каталоге

Вот был у меня вопрос, выраженный в теме Зеркала в Я.Каталоге – какое совсем главное?
А кто-то говорил, что “обратных” примеров не видел. Ну вот пример:
Домен rbistudio.ru – зеркало sweb.ru (завтра освобождается, да и вчера я видел что-то подобное, созвучное, тоже зеркало sweb, видать какой-то чудак купил). 1 ссылка на него.
тИЦ по кнопке – 1700,
тИЦ по “пальцам” – 0, тема “Хостинги”.
Но как он описан в ЯК?
А вот так описан:

“ВГМУ”
http://www.spaceweb.ru/
История и структура университета. Описание факультетов и кафедр. Информация для абитуриентов. Творческая жизнь

Т.е., если недоступно главное зеркало, то показывается “неглавное”. Alex Kirillin, ты же не считаешь, что Sweb когда-то был университетом и попал в качестве главного зеркала в ЯК? 🙂

seo beer conference – 2004

Ездили пить пиво и есть шашлык в лес.
Тема форума здесь.
Фотографии от Gray.
Фотографии от Марго.

Конспект.
Илья не пришел. Пошли в шестером: я, Sim, wayfarer, aleks, Maxil, RedRose. Зачем-то взяли с собой 6 рулонов туалетных полотенец. Завалились в лес. Начали жарить шашлык и есть. Приехал prototype и почему-то Gray с Мишей Козловым. Все были очень рады. Чуть не потеряли в лесу Maxil, который ходил встречать. Они приперли дыню и огромный арбуз, который в итоге остался несъеденным.
Что узнал: какие пузатые в плохом смысле продавцы мерседесов, почему доклад Interitus-а в прошлом году не был принят на конференцию, что произошло между prototype и Smile-ом, посмотрел на его (prototype) бейсбольную биту, почем оптимизация во Владимире, как продавать экскаваторы, попробовал медовуху, на сколько миллионов долларов продают ПО шароварщики, которым Gray рассказывал об оптимизации на ISDEF, о планах использования не-скажу-какого фрихостинга в корыстных целях, что доля в прибыли в 50% для продвиженца – слишком жирно, что надо организовывать фирму, а также историю появления Cossack-a в модераторах Searchengines.ru, о планах Gray по объявлению русскоязычного конкурса по поисковому продвижению.
В очередной раз обсудили то, что Яндекс-каталог не влияет. Не сошлись во мнениях, как обычно.
Вот, собственно, и всё. 🙂

Дорвеи и учет цифр в запросе Яндексу

Скачал и пробил по запросам дорвейный сайтец http://fardek.front.ru . Человек использовал “подход” – на каждый запрос сделал 3 типа дорвеев.
Что интересно – по всем запросам вылезает “первый”, самый простейший тип дорвея.
Но только для запросов вида “Нокия 1234” – всегда вылезает третий тип. Может ли это быть связано с каким-то иным способом учета чисел в запросе, отличным от учета слов? Вероятно.
Версию о падежах не предлагать – все дорвеи использовали только одну форму словосочетаний.
Позиции вот такие:

fardek.front.ru : http://www.yandex.ru/
Запрос|место Thu Sep 16
17:06:25 2004
BIOS скачать 1
бесплатно скачать клипы 2
библиатеки в сети скачать детская литература научная 1
Doom 3 скачать 10
DVD кодек скачать 2
GTA скачать 3
карта Москвы скачать 2
камасутра скачать 5
Miranda скачать 1
мультики скачать 5
Nero скачать 2
ПДД скачать 2
порно фильм скачать 6
порно скачать бесплатно 10
Putty скачать 1
скачать аську 7
скачать ACDSee 13
скачать бесплатно книги 4
скачать Doom2 1
скачать Doom3 3
скачать эротические игры 13
скачать фильм Ночной дозор 4
скачать Flash Player 7 3
шрифты скачать 8
скачать ICQ lite 10
скачать книгу Ночной дозор 3
скачать mscomm32.ocx 4
скачать Mirc 6
скачать Mozilla 5
скачать нарды 1
скачать Norton Utilities 4
скачать Opera 8
скачать полифонические мелодии >20?
Style XP скачать 1
скачать Warcraft 2 1
скачать Winamp 5 2
Ума Турман Ночной дозор скачать 1
Zone Alarm скачать 1
альтернативная музыка >20?
армянская музыка 10
арабская музыка 10
бесплатно музыка >20?
бесплатная mp3 музыка >20?
Дом музыки >20?
электронная музыка >20?
где скачать музыку 6
халявная музыка 5
качать музыку 20
музыка для мобильных >20?
музыка для nokia 17
музыка для сотовых >20?
музыка для телефонов >20?
музыка из фильма Ночной дозор 1
музыка из игр >20?
музыка из кинофильмов >20?
музыка mp 3 4
mp3 музыка бесплатно >20?
mp3 скачать бесплатно музыку 18
Ночной дозор музыка 5
новая музыка >20?
новинки музыки 7
O Zone музыка 2
программы для создания музыки 3
послушать музыку >20?
поиск музыки >20?
популярная музыка >20?
поп музыка >20?
прослушать музыку 2
рок музыка >20?
русская музыка >20?
скачать бесплатно музыку >20?
скачать клубную музыку 2
слушать музыку >20?
скачать музыку без регистрации 2
скачать музыку mp3 >20?
турецкая музыка 8
транс музыка 14
зарубежная музыка >20?
игры для Нокиа 11
картинки для Нокиа 3
клуб Нокиа 1
мелодии для Нокиа 3310 2
мелодии для Нокиа 7
мелодии Нокиа 2
мобильные телефоны Нокиа 6
музыка для Нокиа 1
Нокиа 1100 4
Нокиа 2100 7
Нокиа 3100 13
Нокиа 3200 6
Нокиа 3310 >20?
Нокиа 3650 12
Нокиа 5100 5
Нокиа 5140 2
Нокиа 6100 13
Нокиа 6220 3
Нокиа 6230 13
Нокиа 6260 1
Нокиа 6510 11
Нокиа 6600 13
Нокиа 6610 19
Нокиа 6610i 1
Нокиа 7200 4
Нокиа 7210 19
Нокиа 7250 10
Нокиа 7610 3
Нокиа 7650 10
Нокиа 8210 18
Нокиа 8310 16
программы для Нокиа 6600 2
полифония для Нокиа 1
полифонические мелодии для Нокиа 1
сотовые телефоны Нокиа 2
Aura fate of the ages прохождение 1
Aura прохождение 1
Братья пилоты Обратная сторона Земли прохождение 2
Братья пилоты прохождение 2
Broken Sword 3 прохождение 2
Черный оазис прохождение 2
Черное зеркало прохождение 3
Готика 2 прохождение 3
Готика прохождение 2
коды и прохождения >20?
Mafia прохождение 1
Мафия прохождение 1
Обитель тьмы прохождение 2
Петька 3 прохождение 3
прохождение Alias 1
прохождение Arcanum 1
прохождение Fallout 2 3
прохождение Fallout 4
прохождение Gothic 2 2
прохождение GTA Vice City 3
прохождение Half Life 3
прохождение игры Гарри поттер и узник Азкабана 1
прохождение игры Князь Тьмы 1
прохождение игры Painkiller 2
прохождение игры Сибирь2 2
прохождение игры Sacred 1
прохождение игры В тылу врага 1
прохождения коды 11
Путешествие к центру Земли прохождение 3
прохождения к играм >20?
прохождение Max Payne 2 1
прохождение Neverwinter Nights 5
Периметр прохождение 2
прохождение Post Mortem 1
прохождение Сибирь2 1
прохождение Splinter Cell 2
прохождение Siberia 2 1
прохождение Suffering 1
прохождение Syberia2 2
Власть закона прохождение 1
анимация для мобильных телефонов 2
аксессуары к сотовым телефонам >20?
база данных телефонов 11
бесплатные картинки для телефонов 2
барахолка сотовых телефонов 4
драйвера для телефонов 13
форум мобильные телефоны 8
коды телефонов городов 1
как выбрать телефон 13
Казанский вокзал телефон 1
лучший мобильный телефон 16
мелодии для сотовых телефонов LG 8
мелодии для сотовых телефонов Nokia 20
модели телефонов >20?
мобильные телефоны оптом >20?
мобильные телефоны Panasonic >20?
мобильные телефоны Philips >20?
найти адрес по номеру телефона 2
обои для сотовых телефонов 6
описание мобильного телефона Samsung x100 2
описание телефонов >20?
полифонические мелодии на телефон >20?
продам мобильный телефон >20?
прайс на сотовые телефоны 8
продам сотовый телефон >20?
программа телефон 11
разблокировка телефона 12
софт для мобильных телефонов 11
сравнить мобильные телефоны 1
сотовые телефоны с фотокамерой 9
сотовые телефоны Simens 9
телефоны Екатеринбурга 5
телефоны Иркутска 3
телефон Курского вокзала 2
телефоны Новосибирска 5
телефоны Петербурга 5
телефоны раскладушки >20?
телефон с АОН >20?
телефоны звезд 5
выбор телефона >20?

А вот попробуем поискать нокиа по сайту fardek.front.ru – сплошняком лезут те самые “третьи версии” довеев:

fardek.front.ru/nokia/nokia82103.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia6610i3.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia72003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia11003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia31003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62303.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia21003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia51403.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62203.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/mnokia3.html (4 КБ) — строгое соответствие

Действительно, может, число в запросе как бы “меньшую роль” играет. Нечто среднее между присутствием слова и отсутствием числа.

Конференция – 2004: фсем фтыкать!

Вот здесь тов. Ашманов обещает проанонсировать новую конференцию-2004 по поисковой оптимизации.
А мы его опередим. 🙂
На сайте http://www.optimization.ru/04/program.shtml уже все выложено: (материал, правда, сырой – даже тайтлы не прописаны)

Поисковая оптимизация и продвижение сайтов в Интернете’04

Внимание: программа будет уточняться по мере поступления докладов.
***
25 ноября, четверг
День первый: Продвижение в поисковых машинах

9.30 Регистрация участников, кофе.
10.00-11.30 Вводное заседание. Поисковые машины и продвижение сайтов
12.00-13.30 Заседание 2. Информация из первых рук
15.00 – 16.30 Заседание 3. Контекстная реклама в поисковых машинах
17.00-18.00 Круглый стол
***
26 ноября, пятница
День второй: Практические аспекты продвижения сайтов

10.00 – 11.30 Заседание 4. Техника оптимизации
12.00-13.30 Заседание 5. Работа со ссылками
14.30-16.00 Заседание 6. Оптимизация на практике
16.30-17.30 Заседание 7. Взаимодействие с поисковиками и конкурентами
17.30-18.30 Круглый стол

… все, пошел выдумывать тему доклада и регистрироваться…. 🙂