Перемножать или складывать?

Волнует вопрос: как учитывается совокупность параметров страницы поисковиками.
Пусть есть один параметр, например, частота слова в тексте. Пусть есть другой, например, частота слова в тайтле.
Конечно, зависимость от частоты может быть очень грубой, может быть интервал “одинаковооптимальных” значений частоты.
Но пусть есть 2 параметра (текстовых) релевантности. Скажем, “релевантность по тексту” (x) и “релевантность по тайтлу” (y).
Как они должны комбинироваться при расчете релевантности документа, имеющего и то, и другое?
Первый вариант – перемножить. Но тогда документы с нулевым значением одного из параметров будут в дауне. Если мы ориентируемся на этот вариант, надо набрать максимальное количество “разных” параметров и каждому придать ненулевое значение, а лучше оптимальное. Оптимизировать, типа.
Второй вариант – сложить. Этот вариант плох тем (с т.зр. качества поиска), что действительно релевантные документы, имеющие и то, и другое, не получают преимуществ перед документами, имеющими что-нибудь одно. Если мы ориентируемся на этот вариант, методика действий – выбрать действенный (наиболее) параметр и размножать его. Хотя это напрямую не следует.
***
Отвлечемся.
В каждом из параметров релевантности могут быть намешаны интенсивные (частота слова, f) и экстенсивные (число слов, n) величины. И экстенсивные реально есть. Поэтому тут возможна такая ситуация, что “оптимальности” нет – грубо говоря, возьми страницу в 2 раза больше с такой же частотой слова и получи в 1.89 раза больше релевантности по этому слову. И так далее, пока фантазии хватит.
По-хорошему, здесь зависимость могла бы быть чем-то вроде “колокола” по интенсивной величине, умноженное на экстенсивную величину с затуханием на некоем ее размере.
Что-то вроде:
x=exp(-(1-f/f0)^2)*[1 плюс (n-1)*exp(1-(n/nmax))]
***
Вроде как нужна комбинация первого и второго варианта. Что-то вроде:
R=ax плюс bxy плюс cy

А всю оптимизацию – на фиг, на фиг, на фиг…

Саксесс Стори.
Пришел ко мне клиент. Хороший человек. Хотел ноутбуки продавать. Ну, я ему некие цены выставил, но сказал – вряд ли вы это окупите. Т.е., я вам ничего не гарантирую, ибо тема конкурентная вроде, монстры типа Текарта там рубятся.
Ну и он предложил работать по прибыли. Я согласился. При этом на мне весь онлайн, на нем – весь офлайн.
Пока туда-сюда, я сайт делал, он базу заполнял, пара месяцев прошла. Хорошо еще, что на исходе 3-го месяца (август) продажи пошли. В августе на $1000 прибыли накапало.
В сентябре >$2000 (так-то все 70 тыс. руб., но там еще менеджеру оплата). Оборот за сентябрь – мильон рублей.
Вот и думай тут – нафиг вообще кому-то чужому что-то продвигать?
Может, на фиг всех “клиентов”? Свои магазины делать 🙂

Наконец-то придумал тему доклада для конференции

…на optimization.ru
Зарегистрировался так:
Способы создания контента сайта и организации его структуры для максимизации отдачи от поискового продвижения
Предполагается рассмотреть различные варианты структуры сайтов, предполагающие создание разнообразных страниц для индексации поисковыми системами. В основном предполагается рассмотреть интернет-магазины и коммерческие сайты. Разделы сайта, предназначенные для обмена ссылками.
Как можно наращивать “белый” контент? Создание раздела статей и классификатора, глоссария, новостного раздела, каталога сайтов, своей доски объявлений, форума, каталога сайтов. Создание и индексация страниц магазина – товарного раздела, раздела бренда, страниц товара, страниц заказа и других вспомогательных страниц. Рассмотреть вопросы разделения контента по доменам (субдоменам).

Урродыбл: Иван Ю. Будаев, [email protected]

Блин, ну и история. Спасибо NULL-у, вовремя заметил. Захотел внести апдейт в блог, захожу на FTP – посылает на фиг. В контрольную панель на Мастерхосте – посылает. Пытаюсь на почту себе отправить пароль – говорит: контактная почта другая.
Хорошо. Звоню им. Называю все возможные контактные почты – нет, говорят, не та почта установлена. Шлю скан паспорта – но говорю, не просто поменяйте почту, а старую запишите и мне дайте.
А сам пока начинаю DRWEB’ом сканировать – аж 8 копий бекдора BackDoor.Dumaru.43008 нашел. По возрастающей во всех директориях. А самая глубокая из найденных бекдоров лежала в Temporary и называлась msits[1].exe. Ну, еще 3 штуки VBS.Psyme и одна Win32.HLLW.MyBot.
Ну, итак, – прислали мне мыло того, кто его поменял. [email protected] его мыло.
Мыло не засвечено ни фига, но вот на Рамблере я нашел проиндексированную страницу с этим мылом: http://new.nameserver.ru/domains/NewDomain?name=PACAN
Итак, наш герой-бекдорщик:

domain: PACAN.RU
type: CORPORATE
descr: Domain for Web Server
admin-o: IJB-RIPN
nserver: ns.masterhost.ru.
nserver: ns1.masterhost.ru.
nserver: ns2.masterhost.ru.
mnt-by: MASTERHOST-MNT-RIPN
source: RIPN

person: IVAN JU BUDAEV
nic-hdl: IJB-RIPN
phone: 7 910 4010880
e-mail: [email protected]

Владелец адалт-домена pacan.ru Теперь вот думаю, чего бы мне такого с ним сделать, как грамотно его уничтожать.
Идеи есть?
И что со всеми остальными паролями посоветуете сделать?
Хацкеры. Суки. Бляди. Ненавижу. Персонально Ивана Будаева ненавижу.