Корреляции SiteRank – Inbound hosts

Кстати, к вопросу об аппроксимации PR по числу входящих ссылок:
По хостграфу Яндекса посчитал SiteRank (т.е, по ссылкам между хостами), по обычному уравнению с той же отфонарной d=0.85:
PRi=(1-d) плюс d*sum(PRj/Cj)
И нарисовал корреляцию его с числом ссылающихся хостов:

Вот такие корреляции 🙂 Это не по страницам, конечно, но все-же…

Корреляции SiteRank – Inbound hosts: 10 комментариев

  1. цитата

    Жень, неправильно считал.

    Ты посчитай PRi=(1-d)/N плюс d*sum(PRj/Cj),
    где N – число уравнений в системе

    Так правильней будет.

  2. Я после каждого прохода нормировал на 1. Т.е., на sum(PRi)=N (число хостов). И PR относительный, не в вероятностях, а в вероятностях, умноженных на N.
    Так что все ОК 🙂
    Ну да, плюс я висящие хосты выкидывал, так что число уравнений равно числу хостов.

  3. Нормировать – вроде не то. Надо свободный член модифицировать, как я показал. У него другое влияние должно быть. Попробуй, если не влом, посмотрим, чего получится.

  4. Я об этом думал. Одно и то же получается. Ты лучше сам посчитай по какой-нибудь простой структуре оба случая.
    Мне лишний час на расчет тратить неохота 🙂 Кроме того, ошибок больше накопится – числа будут не порядка 1, а порядка 1/250000.

  5. ну ладно, вы тут пока посчитайте, а мы пивка глотнем или лучше поспим 😉
    а результаты то новые выложите?

  6. Мне лишний час на расчет тратить неохота 🙂

    Ну вот, экспериментатор называется. В таком случае, вообще эксперимент ставить не надо было. Результаты и так предсказуемы 🙂

    Кроме того, ошибок больше накопится – числа будут не порядка 1, а порядка 1/250000.

    И на такие случаи есть методы. 😉

Комментарии запрещены.