Задача с выделением обменов “каждый на каждого”

, т.е, линкаторов – дискретная, а не непрерывная. Не знаю, как выразиться. Невозможно просто написать систему уравнений, разбросать единицы и нолики по системе и считать – ждать, пока непотистские сайты получат коэффициент повыше, а остальные – пониже…
Во-первых, надо задаться “критическим размером” этой группы (сколько сайтов в обмене считается реально опасным).
Во-вторых, надо задаться некой “плотностью перелинковки” внутри каждой группы и между группами. И перемещать сайты из одних групп в другие, иногда сливать группы в одну, иногда убивать и расформировывать группы, размер которых стал меньше критического.
Стратегия линкаторов будет состоять в том, чтобы подделаться под обычный кусочек интернета. Немножко более перелинкованный, но обычный.

Задача с выделением обменов “каждый на каждого”: 35 комментариев

  1. Привет, Евгений.
    правильно ля понял, что твоя система будет использоваться для выявления "ссылочных колец" и возможного понижения/удаления в выдаче?

    Если да, то возможно ли выявить "спамеров" гостевых, форумов и т.п.
    и отделить их от сайтов на которые много ссылаются в качестве цитат, уважения и т.д.

  2. Если да, то возможно ли выявить "спамеров" гостевых, форумов и т.п.

    В этот же скрипт хорошо бы вшить вылавливатель сетей сайтов по номеру телефона.=))

  3. Система – не входит в отчет, это несколько "вещь за рамками". Хотя для Яндекса не жалко.
    Будет ли использоваться – это уже совсем не ко мне вопросы 🙂
    Спамеров гостевых выделить таким способом невозможно, ибо они имеют безвозмездные ссылки с гостевых, и не ссылаются на эти гостевые.

  4. Интересный термин – "плотность перелинковки". Поподробне можно?

  5. Гмм.. Интересная мысль. То есть это та же вероятность (PR – page rank) попасть на страницу А, только с условием, если вы находитесь на странице Б. Придумал термин – 2PR(http://A, http://Б) – 2 pages rank 🙂
    В случае обмена ссылками по тройному кольцу по схеме А – Б – В – А, значения 2PR будут соответственно:
    2PR(А,Б) = 0,5
    2PR(А,В) = 1
    2PR(Б,В) = 0,5
    2PR(В,Б) = 1

    А «плотность перелинкови» для тройного кольца будет равна 0,3333? Или 0,5?

  6. minaton, это мне кажется, или ты немного перемудрил с математикой? 🙂
    По твоей схеме (А -> Б -> В -> А; при условии отсутствия ссылок наружу со всех трех страниц) получается не то, что ты написал, а иначе (я еще и порядок немного изменил):
    2PR(А, Б) = 1
    2PR(Б, B) = 1
    2PR(В, А) = 1
    Следствие:
    2PR(А, В) = 2PR(А, Б) * 2PR(Б, B) = 1
    2PR(Б, А) = 2PR(Б, В) * 2PR(В, А) = 1
    2PR(В, Б) = 2PR(В, А) * 2PR(А, Б) = 1

    Итого, плотность перелинковки тройного кольца = 1

    При наличии ссылок наружу, конечно, будет не все так "радужно" 🙂

  7. А как насчет неперекрестного обмена ссылками?

    В смысле:
    A->B
    C->D

    Где A, D – первого хозяина, C, B – второго?

    Есть какие-нибудь идеи, как это ловить? Точно ведь, если тот же Yandex станет "гасить" сайты, линкованные "цепочками", то очень быстро поднимется волна с именно такой линковкой. И в выигрыше останутся только оптимизаторские конторы, а владельцы одиночных сайтов потеряют всякую возможность завоёвывать нормальные позиции в поиске.

    PS Обнаружил, что Google очень хорошо реагирует на "перенасыщенные" по ключевым словам странички. И никакого понижения ранга. PR существеннее, чем спамерские методы оптимизации страницы???

  8. Тут есть 2 подхода, имхо.
    Один – если сайт ссылается на только сайты внутри некой группы (непотистской), то плотность перелинковки =1 :
    >Итого, плотность перелинковки тройного кольца = 1
    Однако, в этом случае при реальном расчете (сливая непотистские группы в одну и перемещая сайты из группы в группу) для любого размера колец мы имеем хорошие шансы объединить весь инет в одно непотистское кольцо. Это не есть гуд 🙂
    Другой подход – проводить резкую границу между сайтами в линкаторах вида "каждый на каждого" и сайтов, принадлежащих обычному инету.
    Т.е., эта граница будет следовать из реальных характеристик инета. Разброса групп (реальных, хороших т.е.) по плотности перелинковки и отсюда граничных показателей.

  9. E0LiN, если 2 подсистемы никак не связаны – очевидно, независимо друг от друга ловить.
    Я к тому, что чобы из этой схемы была реальная выгода, исходные сайты (которые ссылаются) должны быть тоже накачаны! А вот как они будут накачиваться – отсюда будет следовать алгоритм отлова.

  10. LiM
    Как я понимаю, в схеме «А -> Б -> В -> А», 2PR(А,Б) – это вероятность попасть на страницу А со страницы Б. У нас есть ссылка наоборот – со страницы А на страницу Б. Поэтому 2PR(А,Б) не может быть равен 1. Хотя я наверняка перемудрил 🙂 тут не хватает еще одного параметра – количества итераций. Ведь в конечном итоге, через бесконечное количество переходов мы теоретически можем попасть с любой страницы на любую… И все это с условием отсутствия других внешних ссылок, что в принципе нереально и не соответствует действительности. Блин, надо теорию вероятностей перечитать…

  11. minaton,
    Ой, я тоже намудрил… 🙁
    Ведь в вашем примере 2PR(А, Б) – это "вероятность попасть на страницу А, только с условием, если вы находитесь на странице Б". Непривычный порядок параметров – обычно наоборот делают.

    По теории вероятностей если дано 2PR(А, Б) и 2PR(Б, В), то вероятность 2PR(А, В) будет произведением данных, а не суммой – в этом была ваша ошибка в первом сообщении. В остальном же ошибок не было (не считая моей невнимательности, описанной выше).

    Женя тут уже сказал все, что думает, про наш метод. 🙂 Как я понял, смысла его развивать особо нет…

    Хотя, думаю, есть вариант развития с ограничением размеров групп, который предотвратит слияние всего интернета в одну группу.

  12. Евгений! Нескромный вопрос, а ты вообще на линкаторы смотрел? Я так и не понял, каким образом твоей методой их можно отловить?

    Там же частенько такие помойки, что только диву даешься. Т.е. в сайтах этих групп идут еще межгрупповые перелинковки, которые довольно тяжко отследить. Т.е. на некоторые сайты в группах участвуют в разных системах, а некоторые и не в одной.

    Я уж не говорю о покупных ссылках. Кстати… Меня никто не может просветить, на кой хрен эти покупные ссылки распиханы на 6000 одинаковых страниц (только параметры урлов разные). А то до меня долго доходило, когда на моих тестовых сайтах (на каждом по одной системе обмена) вдруг откуда-то вылезло по 5-7 тыс. страниц в яндексе. Это с учетом того, что на меня то ссылаются всего по 50-100 сайтов, да и я давал задание не очень форсировать обмен, так что там прошел обмен не более чем с 200 сайтами.

    И вот уж когда стал разбираться выяснил такую бодягу о жутком количестве дублей… И сразу яндекс стало жалко… Правда эксперимент продолжил:)…

  13. >Нескромный вопрос, а ты вообще на линкаторы смотрел?
    -не понял вопроса…
    Это не метода пока, мысли, как этот отлов организовать…

  14. Это не метода пока, мысли, как этот отлов организовать…

    Я просто показал, что это скорее всего будет нереально (и однозначно обходимо), за счет различной степени пересечения групп. Очень маловероятно, что удасться подобрать такие коэффициенты, чтобы все сходилось к устойчивому состоянию и выделяло большие кольца. Хотя возможно мелкие кольца одного владельца, который умудрился перелинковать все свое на все свое могут и попасться.

    Гугл по крайней мере не пошел по пути подобных рассчетов из-за их неустойчивости и потребности огромных ресурсов. Значительно лучше выглядит просмотр исторической ретроспективы появления ссылок, создание массивов подозрительных доменов и на основе этого автоматическая отправка в песок или в бан большого количества дорвеев и вообще, продвигаемых левой накачкой ссылок, сайтов.

    Конечно и тут есть определенные проблемы со сходимостью. Но здесь требуется не попадание в какой-то конкретный интервал (иначе все либо расползется на весь инет, либо схлопнется в ноль), а просто постепенное увеличение нескольких коэффициентов. Скорее всего гуглу потребуется 1-2 года не то, чтобы подобрать нужные коэффициенты (там конечно считать надо до хрена), до тех пор, пока не удасться загасить подобляющее большинство дорвеев этим методом.

    К сожалению, для рунета этот способ скорее всего не подойдет из-за малой базы для достоверности статистических рассчетов.

  15. >Я просто показал, что это скорее всего будет нереально (и однозначно обходимо), за счет различной степени пересечения групп.
    -пересечение (надеюсь, ты имел в виду перелинковывание :)?) групп, понятно, будет, но я не увидел, где именно ты показал, что это нереально?

  16. Евгений, есть ли разграничение при твоей системе "отлова" для сайтов, участвующих в тематических веб-кольцах и и сайтов, использующих линкаторы? Если учесть, что мозги создателей линкаторов постоянно заточены на утаивание перелинковки, то в первую очередь пострадать могут именно веб-кольца.

  17. Женя, принципиально webring отличается от линкаторов, тем что на сайте участника нет списка участников ;)) поэтому и страдать тематические каталоги-webring’и не будут …

  18. печально не печально .. однако зачастую по высокочастотникам по другому конкурировать не получается.. и приходится создавать свои кольца

  19. Professor, если это все… 🙂 То печально я гляжу на вебринги…

    Правильно! Гриша, снимай ставку с вебрингов. 😉

  20. wolf, в смысле ставку? пусть пока людям помогает … а там посмотрим …

  21. aleks, расскажи какие "кольца" ты делаешь? ;)))

  22. тематические :)))
    к примеру:
    1) делается 3-5 ть интернет магазинов, которые завязываюстя друг с другом.. которые собственно являются разными сайтами, с приблизительно одинаковым ассортиментом, но несколько отличающимися описаниями этих самих наименований
    2) завязываются друг с другом ресурсы дружественных компаний по схожим тематикам

  23. >делается 3-5 ть интернет магазинов, которые завязываюстя друг с другом..
    это уже не webring, а hilltop получается

  24. aleks, на грани фола …

    почему?
    по-сути каждый в отдельности это отдельный сайт.. со своей базой данных, т.е. не используется одна БД.. преподносятся разные позиции продукции.. практикуется отличающееся друг от друга описание продукции…
    единственно там телефоны одни и те же… ну и структура схожая…

  25. это уже не webring, а hilltop получается

    NULL, что ты понимаешь под hilltop-ом? (если не сложно покажи пример)

  26. wolf, в смысле ставку? пусть пока людям помогает … а там посмотрим …

    Ну-ну, как там мадам Шипокляк говорила? "Кто людям помогает, тот тратит время зря…" 🙂 Шутка.

    А вообще, боюсь, веб-ринги могут за компанию с линк-фармами загреметь под фанфары.

  27. aleks,
    >печально не печально .. однако зачастую по высокочастотникам по другому конкурировать не получается
    -по какому не получается? 🙂 Без линкаторов? Без вебрингов? Да вообще-то получается… Хотя и случайно.

Комментарии запрещены.