, т.е, линкаторов – дискретная, а не непрерывная. Не знаю, как выразиться. Невозможно просто написать систему уравнений, разбросать единицы и нолики по системе и считать – ждать, пока непотистские сайты получат коэффициент повыше, а остальные – пониже…
Во-первых, надо задаться “критическим размером” этой группы (сколько сайтов в обмене считается реально опасным).
Во-вторых, надо задаться некой “плотностью перелинковки” внутри каждой группы и между группами. И перемещать сайты из одних групп в другие, иногда сливать группы в одну, иногда убивать и расформировывать группы, размер которых стал меньше критического.
Стратегия линкаторов будет состоять в том, чтобы подделаться под обычный кусочек интернета. Немножко более перелинкованный, но обычный.
Задача с выделением обменов “каждый на каждого”: 35 комментариев
Комментарии запрещены.
Привет, Евгений.
правильно ля понял, что твоя система будет использоваться для выявления "ссылочных колец" и возможного понижения/удаления в выдаче?
Если да, то возможно ли выявить "спамеров" гостевых, форумов и т.п.
и отделить их от сайтов на которые много ссылаются в качестве цитат, уважения и т.д.
В этот же скрипт хорошо бы вшить вылавливатель сетей сайтов по номеру телефона.=))
Система – не входит в отчет, это несколько "вещь за рамками". Хотя для Яндекса не жалко.
Будет ли использоваться – это уже совсем не ко мне вопросы 🙂
Спамеров гостевых выделить таким способом невозможно, ибо они имеют безвозмездные ссылки с гостевых, и не ссылаются на эти гостевые.
Интересный термин – "плотность перелинковки". Поподробне можно?
Нутром чую, что литр, а объяснить не могу.. 🙂
Если каждый на каждого – это плотность перелинковки=1.
Гмм.. Интересная мысль. То есть это та же вероятность (PR – page rank) попасть на страницу А, только с условием, если вы находитесь на странице Б. Придумал термин – 2PR(http://A, http://Б) – 2 pages rank 🙂
В случае обмена ссылками по тройному кольцу по схеме А – Б – В – А, значения 2PR будут соответственно:
2PR(А,Б) = 0,5
2PR(А,В) = 1
2PR(Б,В) = 0,5
2PR(В,Б) = 1
А «плотность перелинкови» для тройного кольца будет равна 0,3333? Или 0,5?
minaton, это мне кажется, или ты немного перемудрил с математикой? 🙂
По твоей схеме (А -> Б -> В -> А; при условии отсутствия ссылок наружу со всех трех страниц) получается не то, что ты написал, а иначе (я еще и порядок немного изменил):
2PR(А, Б) = 1
2PR(Б, B) = 1
2PR(В, А) = 1
Следствие:
2PR(А, В) = 2PR(А, Б) * 2PR(Б, B) = 1
2PR(Б, А) = 2PR(Б, В) * 2PR(В, А) = 1
2PR(В, Б) = 2PR(В, А) * 2PR(А, Б) = 1
Итого, плотность перелинковки тройного кольца = 1
При наличии ссылок наружу, конечно, будет не все так "радужно" 🙂
А как насчет неперекрестного обмена ссылками?
В смысле:
A->B
C->D
Где A, D – первого хозяина, C, B – второго?
Есть какие-нибудь идеи, как это ловить? Точно ведь, если тот же Yandex станет "гасить" сайты, линкованные "цепочками", то очень быстро поднимется волна с именно такой линковкой. И в выигрыше останутся только оптимизаторские конторы, а владельцы одиночных сайтов потеряют всякую возможность завоёвывать нормальные позиции в поиске.
PS Обнаружил, что Google очень хорошо реагирует на "перенасыщенные" по ключевым словам странички. И никакого понижения ранга. PR существеннее, чем спамерские методы оптимизации страницы???
Тут есть 2 подхода, имхо.
Один – если сайт ссылается на только сайты внутри некой группы (непотистской), то плотность перелинковки =1 :
>Итого, плотность перелинковки тройного кольца = 1
Однако, в этом случае при реальном расчете (сливая непотистские группы в одну и перемещая сайты из группы в группу) для любого размера колец мы имеем хорошие шансы объединить весь инет в одно непотистское кольцо. Это не есть гуд 🙂
Другой подход – проводить резкую границу между сайтами в линкаторах вида "каждый на каждого" и сайтов, принадлежащих обычному инету.
Т.е., эта граница будет следовать из реальных характеристик инета. Разброса групп (реальных, хороших т.е.) по плотности перелинковки и отсюда граничных показателей.
E0LiN, если 2 подсистемы никак не связаны – очевидно, независимо друг от друга ловить.
Я к тому, что чобы из этой схемы была реальная выгода, исходные сайты (которые ссылаются) должны быть тоже накачаны! А вот как они будут накачиваться – отсюда будет следовать алгоритм отлова.
LiM
Как я понимаю, в схеме «А -> Б -> В -> А», 2PR(А,Б) – это вероятность попасть на страницу А со страницы Б. У нас есть ссылка наоборот – со страницы А на страницу Б. Поэтому 2PR(А,Б) не может быть равен 1. Хотя я наверняка перемудрил 🙂 тут не хватает еще одного параметра – количества итераций. Ведь в конечном итоге, через бесконечное количество переходов мы теоретически можем попасть с любой страницы на любую… И все это с условием отсутствия других внешних ссылок, что в принципе нереально и не соответствует действительности. Блин, надо теорию вероятностей перечитать…
minaton,
Ой, я тоже намудрил… 🙁
Ведь в вашем примере 2PR(А, Б) – это "вероятность попасть на страницу А, только с условием, если вы находитесь на странице Б". Непривычный порядок параметров – обычно наоборот делают.
По теории вероятностей если дано 2PR(А, Б) и 2PR(Б, В), то вероятность 2PR(А, В) будет произведением данных, а не суммой – в этом была ваша ошибка в первом сообщении. В остальном же ошибок не было (не считая моей невнимательности, описанной выше).
Женя тут уже сказал все, что думает, про наш метод. 🙂 Как я понял, смысла его развивать особо нет…
Хотя, думаю, есть вариант развития с ограничением размеров групп, который предотвратит слияние всего интернета в одну группу.
Евгений! Нескромный вопрос, а ты вообще на линкаторы смотрел? Я так и не понял, каким образом твоей методой их можно отловить?
Там же частенько такие помойки, что только диву даешься. Т.е. в сайтах этих групп идут еще межгрупповые перелинковки, которые довольно тяжко отследить. Т.е. на некоторые сайты в группах участвуют в разных системах, а некоторые и не в одной.
Я уж не говорю о покупных ссылках. Кстати… Меня никто не может просветить, на кой хрен эти покупные ссылки распиханы на 6000 одинаковых страниц (только параметры урлов разные). А то до меня долго доходило, когда на моих тестовых сайтах (на каждом по одной системе обмена) вдруг откуда-то вылезло по 5-7 тыс. страниц в яндексе. Это с учетом того, что на меня то ссылаются всего по 50-100 сайтов, да и я давал задание не очень форсировать обмен, так что там прошел обмен не более чем с 200 сайтами.
И вот уж когда стал разбираться выяснил такую бодягу о жутком количестве дублей… И сразу яндекс стало жалко… Правда эксперимент продолжил:)…
>Нескромный вопрос, а ты вообще на линкаторы смотрел?
-не понял вопроса…
Это не метода пока, мысли, как этот отлов организовать…
Я просто показал, что это скорее всего будет нереально (и однозначно обходимо), за счет различной степени пересечения групп. Очень маловероятно, что удасться подобрать такие коэффициенты, чтобы все сходилось к устойчивому состоянию и выделяло большие кольца. Хотя возможно мелкие кольца одного владельца, который умудрился перелинковать все свое на все свое могут и попасться.
Гугл по крайней мере не пошел по пути подобных рассчетов из-за их неустойчивости и потребности огромных ресурсов. Значительно лучше выглядит просмотр исторической ретроспективы появления ссылок, создание массивов подозрительных доменов и на основе этого автоматическая отправка в песок или в бан большого количества дорвеев и вообще, продвигаемых левой накачкой ссылок, сайтов.
Конечно и тут есть определенные проблемы со сходимостью. Но здесь требуется не попадание в какой-то конкретный интервал (иначе все либо расползется на весь инет, либо схлопнется в ноль), а просто постепенное увеличение нескольких коэффициентов. Скорее всего гуглу потребуется 1-2 года не то, чтобы подобрать нужные коэффициенты (там конечно считать надо до хрена), до тех пор, пока не удасться загасить подобляющее большинство дорвеев этим методом.
К сожалению, для рунета этот способ скорее всего не подойдет из-за малой базы для достоверности статистических рассчетов.
>Я просто показал, что это скорее всего будет нереально (и однозначно обходимо), за счет различной степени пересечения групп.
-пересечение (надеюсь, ты имел в виду перелинковывание :)?) групп, понятно, будет, но я не увидел, где именно ты показал, что это нереально?
Евгений, есть ли разграничение при твоей системе "отлова" для сайтов, участвующих в тематических веб-кольцах и и сайтов, использующих линкаторы? Если учесть, что мозги создателей линкаторов постоянно заточены на утаивание перелинковки, то в первую очередь пострадать могут именно веб-кольца.
А чем веб-кольцо принципиально отличается от линкаторов? Разве что тематичностью. А тематика из ссылок не определяется.
Женя, принципиально webring отличается от линкаторов, тем что на сайте участника нет списка участников ;)) поэтому и страдать тематические каталоги-webring’и не будут …
Professor, если это все… 🙂 То печально я гляжу на вебринги…
печально не печально .. однако зачастую по высокочастотникам по другому конкурировать не получается.. и приходится создавать свои кольца
Правильно! Гриша, снимай ставку с вебрингов. 😉
wolf, в смысле ставку? пусть пока людям помогает … а там посмотрим …
aleks, ты говоришь про непот ссылки ?
нет
aleks, расскажи какие "кольца" ты делаешь? ;)))
тематические :)))
к примеру:
1) делается 3-5 ть интернет магазинов, которые завязываюстя друг с другом.. которые собственно являются разными сайтами, с приблизительно одинаковым ассортиментом, но несколько отличающимися описаниями этих самих наименований
2) завязываются друг с другом ресурсы дружественных компаний по схожим тематикам
aleks, на грани фола …
>делается 3-5 ть интернет магазинов, которые завязываюстя друг с другом..
это уже не webring, а hilltop получается
почему?
по-сути каждый в отдельности это отдельный сайт.. со своей базой данных, т.е. не используется одна БД.. преподносятся разные позиции продукции.. практикуется отличающееся друг от друга описание продукции…
единственно там телефоны одни и те же… ну и структура схожая…
NULL, что ты понимаешь под hilltop-ом? (если не сложно покажи пример)
Ну-ну, как там мадам Шипокляк говорила? "Кто людям помогает, тот тратит время зря…" 🙂 Шутка.
А вообще, боюсь, веб-ринги могут за компанию с линк-фармами загреметь под фанфары.
То, что и все остальные:
http://www.google.com/search?hl=en&lr=&q=hilltop seo&btnG=Search
aleks,
>печально не печально .. однако зачастую по высокочастотникам по другому конкурировать не получается
-по какому не получается? 🙂 Без линкаторов? Без вебрингов? Да вообще-то получается… Хотя и случайно.
Почему яндекс не хочет добавлять http://mobiloid.net вой каталог?