Кстати, к вопросу об аппроксимации PR по числу входящих ссылок:
По хостграфу Яндекса посчитал SiteRank (т.е, по ссылкам между хостами), по обычному уравнению с той же отфонарной d=0.85:
PRi=(1-d) плюс d*sum(PRj/Cj)
И нарисовал корреляцию его с числом ссылающихся хостов:
Вот такие корреляции 🙂 Это не по страницам, конечно, но все-же…
Корреляции SiteRank – Inbound hosts: 10 комментариев
Комментарии запрещены.
Жень, неправильно считал.
Ты посчитай PRi=(1-d)/N плюс d*sum(PRj/Cj),
где N – число уравнений в системе
Так правильней будет.
Я после каждого прохода нормировал на 1. Т.е., на sum(PRi)=N (число хостов). И PR относительный, не в вероятностях, а в вероятностях, умноженных на N.
Так что все ОК 🙂
Ну да, плюс я висящие хосты выкидывал, так что число уравнений равно числу хостов.
Нормировать – вроде не то. Надо свободный член модифицировать, как я показал. У него другое влияние должно быть. Попробуй, если не влом, посмотрим, чего получится.
Я об этом думал. Одно и то же получается. Ты лучше сам посчитай по какой-нибудь простой структуре оба случая.
Мне лишний час на расчет тратить неохота 🙂 Кроме того, ошибок больше накопится – числа будут не порядка 1, а порядка 1/250000.
ну ладно, вы тут пока посчитайте, а мы пивка глотнем или лучше поспим 😉
а результаты то новые выложите?
Ну вот, экспериментатор называется. В таком случае, вообще эксперимент ставить не надо было. Результаты и так предсказуемы 🙂
И на такие случаи есть методы. 😉
Серег, я тебе готов доказать, что это одно и то же.
Мне докажи, я интрересуюсь.
Лучше тогда тему на searchengines заведи, у меня тут с плюсиками проблема.
Завел: http://forum.searchengines.ru/showthread.php?s=&threadid=20492