дорвеи – Страница 2 – Евгений Трофименко: SEO и не только

Если бы я был поисковиком,

… я бы дорвеи уничтожал следующим образом.
Дорвеи бывают какие:
1) Из полностью генеренного текста, с долей ключевика и разных всяких частей речи в нужных пропорциях.
2) Сделанные из нормального текста со вставками ключевых слов или фраз в текст (или заменами части слов на ключевик).
3) Сделанные из блоков нормального контента на левую тему и блоков текста с ключевиками, тоже нормального и человеческого.
***
Дорвеи первого типа, полностью генеренные. Плюс для дорвейщика: уникальность текста – он действительно уникален. Минус для человека: бред полный написан. Но главное – их легче определять. Например, у поисковиков есть специальные эвристики, наборы правил для нормализации (приведения слова к нормальной форме) – причем простенькие. Это называется стемминг. Лежат в открытом доступе.
Логично, что и прикидку по падежам, числам, склонениям и т.п. робот поисковика может с хорошей вероятностью угадать, не залезая в словарь. И рассогласования. например, в числе существительного и прилагательного, стоящих рядом, отловить. И многое другое того же рода.
Понятно, что включать звоночек модератору автомат будет только при тотально неграмотном тексте (в пределах документа, раздела, сайта…). А для снижения нагрузки можно не по каждому термину документа эту проверку делать, а только по тем, которых заметная доля (в тех же пределах, сайта или документа) или просто тех, которые на странице больше 1 раза встречаются. 🙂

Дорвеи третьего типа. Плюс для человека – язык нормальный, человеческий. Минус для дорвейщика: неуникальность фраз, предложений, блоков текста. Причем если “левый” контент еще можно натырить из разных мест и сделать его малоповторяющимся, то с текстом с ключевиками такое не пройдет.
Ну способы ловли неуникальных фрагментов описаны, например, у И. Сегаловича. Ставим длину шингла поменьше, ищем в пределах сайта… Определяем, что ключевой текст размазан тонким слоем по сайту.
Их, в общем-то, и банить не надо, пессимизировать достаточно.

Ну и дорвеи второго типа. Посложнее, т.к. здесь и куски текста более уникальные, и ошибок в согласовании меньше (допустим даже, что их нет!, т.е., дорвейщик и падеж правильный поставил, и вместо существительного существительное влепил – все по уму).
Однако ж юзер, читая текст, легко определит дорвей. А для робота маркером может быть, конечно, не отсутствие смысла в тексте, а наличие большого количества пар слов, которые не употребляются (редко употребляются) в нормальной жизни. Типа “зеленая турфирма”, “радостный ноутбук” и т.п. Только есть закавыка – слов много, а их пар – еще больше… 🙁
На это есть решение. Во-первых, данные о частоте употребления тех или иных слов хранятся. Берем “часто употребительные” слова, отдельно по частям речи. Планку на “часто” ставим исходя из общего объема расчетов и объема, выделенного под хранении информации о парах слов. Дальше по выбранным словам строим заведомо подъемное количество пар слов (в нормальных формах) и пробиваем, насколько часто в базе встречается каждая.
Дальше смотрим на статистику и ставим еще одну планку, отделяющую “разумные” пары слов и выбрасывающую “неразумные”.
Ну и по документу (разделу, сайту…) смотрим, сколько среди “значимых” слов есть “разумных” и “неразумных” пар. И если неразумных много – звоним в звоночек модератору…

***
Все. Остается только ждать. 🙂

PS Кстати, текст, генеренный с исп. цепей Маркова, не берется такими способами… Упс. Но зато в этот текст по своему хотению кейвордов напихать сложно.

Набор Quality raters в Google

Открыт набор парт-тайм воркеров, которые будут заниматься оценкой качества рекламы и результатов поиска в Гугле. Правда, там какие-то ограничения на местоположение (точно не понял), но что стоит настоящему дорвейщику найти халявный канадский прокси? 🙂

ABE Services is recruiting part-time remote workers to help with search quality evaluation on a project basis for Google, Inc., the search engine company based in Mountain View, California. Candidates must be web-savvy and analytical, have excellent web research skills and a broad range of interests. Specific areas of expertise are highly desirable.

-мдя. А разговоры-то о расчете “рейтинга доверия” не зря, видимо… 🙂
Интересно, он будет как PageRank рассчитываться с запитыванием от просмотренных ассессорами сайтов?
Или это просто расширенный алгоритм для стука?
via wolf

Дорвеи против сайтов в выдаче

На форуме – BUFO говорит: “дорвей выполняет свою функцию ЛУЧШЕ сайта поскольку, как правило, ведет пользователя на то что тот ищет”, а svift ему: “ты так далеко ща зайдешь, типа и женщины ни к чему, отверстия то и в заборе есть”.
Дорвейщики обиделись… 🙂
А кстати, аналогия хорошая. Да и навевает ее тем, что среди “новых дорвейщиков” (умаксят) много бывших (неудачливых, наверное) адалтщиков.
ЗЫ Дорвеи, как обычно, плохо – т.к. они являются дешевой технологией получения трафика, все это ведет к снижению качества выдачи и ее загаживанию.

Этика в поисковой оптимизации

Во дни сомнений, во дни тягостных раздумий… 🙂
Анар начал тему (извините, он болел :)) Этика в поисковой оптимизации
Отношение у меня двойственное.. С одной стороны, этика – это круто. Это типа клево и все такое. Но как Анар об этом говорит?
У него все вокруг, получается, виноваты. Ему говоришь – а что, нужно отказать optimism.ru в рекламе из-за того, что Рома Клевцов создал Линкатор? Анар ни да, ни нет не отвечает. Только отвечает – а доколе же мы будем спамить и отбрехиваться? Что ни спроси – (в первой половине обсуждения) – ответ именно такого смысла. Типа, ты вот мне вопросы по существу задаешь? Как? По существу, т.е., персонально??? Да доколе ж мы будем спамить и отбрехиваться???
Во второй половине он сказал, что выздоравливает. 🙂
Я вот например, точно знаю, что Клевцов “делал” и неосапы, и линкаторы. И что? Люди в них участвуют добровольно, и в этом есть большая вина того же Яндекса. Яндекс не умеет или не желает ЧЕТКО выразить свою позицию. Колмановская написала шаблон для выражения мнений для пиаротдела – и вперед, любой сотрудник Яндекса радостно ответит – я заранее знаю! – что “мы против любых действий, ведущих к необоснованному увеличению ссылочной популярности (или, еще более общо – позиций в поиске)”.
А что в результате? В результате на сайте Линкатора написано, что “наша методика не противоречит политике посиковиков”. А Яндекс и Рамблер не соизволили высказаться громко. Они посчитали, что недостойно это, слишком мелко, не про них писано. И отделался Яндекс общими фразами.
А проблема в том, что мы-то чуем задницей, что все это плохо кончится, а многие достойные сайты вступили в систему. И что, теперь их всех банить? Себе же хуже. Алгоритмы фиттить? Дорого и долго, хотя другого пути нет. Ручками работать, банить скрипеть зубами и терпеть.
Вообще, этика в оптимизации, ИМХО, заключается в
1) не обманывании заказчика на предмет гарантий,
2) неделании дорвеев (хотя это свидетельствует о недостаточном опыте и весе головного мозга “оптимизатора” – ибо любой дорвей можно даже автоматическими методами превратить в полезную юзеру страницу)
3) не использовании ссылочного спама по гостевым и блогам – ибо это мешает владельцам гестов и блогов.
В общем-то, все.
Сколько людей – столько мнений. Вот svift, например, считает, что обмен блоками ссылок – это спам и неэтично. А вот Adlabs предлагает со своего сайта обмен блоками для всех своих клиентов.
Я не считаю, что это спам, но не пользуюсь обменом блоками. И даже (тссс!) насчет Ликатора есть сомнения…
На одной из конференций (кажется, на второй) Сашу Садовского спросили – а что сделает Яндекс, если Бегун станет продавать свои клики, размещая прямые ссылки? Он это может делать. Саша сказал – когда начнут, тогда и будем думать…
Ведь в чем дело? Почему загаживается выдача? Ведь именно в выдаче и ее качестве проблема. То, что тот же Линкатор не комильфо – дак его же никто не видит! ссылка не ликаторный раздел ныкается куда-нибудь глубоко – и никакого ущерба имиджу сайта среди посетителей не наносит!
А проблема в том, что Линкатор, блоки ссылок, спам гостевых и форумов, невидимые тексты и др. – СНИЖАЮТ ПОРОГ ВХОДА НА РЫНОК.
Ведь есть приходы с поиска и конвертация посетителей в клиентов. Конвертация зависит от чего? От дизайна, юзабилити, цен.
Хороший дизайнер хороший дизайн за копейки делать не будет. Хороший юзабилист, программер, копирайтер за копейки не работают. Так что расходы на конвертацию посетителей не могут быть малыми.
И возникает проблема – участие в Линкаторе, ссылочные блоки, дорвеи и др. позволяют легче, а значит, дешевле, достичь целевых заходов. Дешевле. И неважно, как предлагаются эти дешевые посетители – ведь позиций в поиске можно ДЕШЕВО ДОСТИЧЬ БЕЛЫМИ МЕТОДАМИ! Наняв студентов писать письма (не спам) и региться руками в каталогах.
Но если заказчик получает результат дешево – у него нет стимула тратиться на конвертацию! Он на улучшение сайта – на статьи тематические, на разработку правильного дизайна, на поддержку форума затратит много бабла.
А зачем ему???
Проще закупить продвижение не одного сайта, а трех сразу! Или десяти! За те же деньги.
Да, конвертация будет маленькой, но за счет потока народа отдача будет гораздо выше, чем от улучшения самого сайта.
Единственно, что посетители будут плеваться. Да и хрен с ними. Ведь результат достигнут честными методами? Тогда и нет проблем!
Вот эта ДЕШЕВИЗНА УСЛУГ и приводит к загаживанию рунета и буржуинета. А сам Линкатор, спам гестов, обмен блоками, создание отдельных страничек под запросы (они ведь в теме с Анаром и про это начали спорить – а вот вы все морду пихаете! а вот вы отдельные странички делаете! :)), просто нетематический обмен ссылками, обмен тематическими ссылками – ЭТО ВСЕ ЗЛО ПРИ ДЕШЕВИЗНЕ УСЛУГ!
Типа сказал…
PS А Анар действительно болел. 🙂

не будем смотреть друг другу в бекварды

Достойно занесения в анналы – Цитата из Павла Васина – нового менеджера по партнерствам Бегуна:

Давайте не будем смотреть друг другу в бекварды 😉

-фраза, напоминающая что-то из классики… Дареному коню в бекварды не смотрят…
Кстати, по поводу трафа с дорвееподобных сайтов Павел говорит, что:

“Порно” будет продолжаться до тех пор, пока Бегун не закончит ревизию всех партнерских сайтов, количество которых очень и очень велико.

-т.е., годы, что ли?
Хорошо, когда отвечают по делу и понятно… Из Никиты Шермана приходилось клещами выпытывать…
PS Хотя в наше время без смотрения в бекварды друг другу ой как сложно… 🙂
PPS Нет, не так. Халявным ссылкам в бекварды не смотрят… Бесплатному трафу в рефы не смотрят… И т.п. 🙂

Алгоритм Яндекса by iseg – фсем фтыкать!

Илья Сегалович в своем ЖЖ дает ссылку на статью Яндекс на РОМИП-2004. Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс.
Ну наконец-то что-то полезное.
Хотя многое было интуитивно понятно.
По пунктикам:

Основной поисковый оператор Яндекса — «многоместный оператор AND» с неявно назначенными ограничениями контекста между соседними словами запроса.

– “ограничения контекста” – я сначала подумал, что речь идет о расстояниях в предложениях и словах, которые вставляет колдунщик. Но в конце статьи промелькнуло, что еще в пределах документа – один из возможных контекстов.
Кстати, в ЖЖ Илья объясняет подробнее про это:

Теперь о логическом уровне. О нем говорится фразой “многоместный оператор AND”. Ну то есть мы не делаем так: A /1 B /1 C => X = (A /1 B); Y = X /1 C

Пример:
Опорные слова в пассаже (1) выглядят так: _ _ a b a c _ _
Опорные слова в пассаже (2) выглядят так: _ _ a b c _ _

Двуместная логика при упрощенной реализации может привести (и приводило годах в 1995-1996) к нахождению лишних пассажей. Скажем, по указанному выше запросу может быть найден не только пассаж (2) но и пассаж (1). А ведь слова B и C должны стоять рядом!

Что касается неявного назначения контекста, то мы про это писали: контекст назначается как правило, не пользователем, а на стадии препроцессинга запроса.

-ну точно, колдунщик. Спешите видеть. Пока переколдованный запрос еще виден.

Принципиальной особенностью Яндекса является оперирование только позициями слов, удовлетворяющих ограничениям контекста. Это позволяет резко сократить число операций над документами.

-о! ну и позже говорится, что частота вычисляется только по соовам удовлетворяющим огр. контекста.

о процедуре вычисления неявных контекстных ограничений, применяемой в распределенной версии поиска Яндекса. В этом случае на серверах «переднего края» [6] производится синтаксический разбор запроса на основе ATN-грамматики [7], адаптированной к свободному порядку слов русского языка. С учетом рваного «телеграфного» стиля в естественно-языковых фрагментах запросов выявляются несколько видов синтаксической связей (притяжание, перечисление, зависимости цели и места, счетные конструкции и др.) и устанавливаются эмпирически подобранные контекстные ограничения.

…и между словами вставляются расстояния в предложениях, словах и т.п. Так, пойти посмотреть, как они эти притяжания и перечисления в результатах переколдовки представляют. И алгоритм не нужно думать – спасибо, сами сказали. 🙂

синтаксический разбор запроса на основе ATN-грамматики [7], адаптированной к свободному порядку слов русского языка

-не понял, что за грамматика и адаптация к свободному порядку слов. Пойти почитать.

Глобальная для всех коллекций статистика слов используется как для «выравнивания» ранжирования между коллекциями [6]

-не понял. Учет IDF или что… Коллекция – это же вся база документов.

Имея на входе многоместного оператора треугольную матрицу контекстных ограничений между словами запроса

-почему треугольную?… Видимо, это они многоместный оператор “И” так реализуют. Тогда получается, что некоторая кривизна в ограничении контекста между “далекими” словами будет присутствовать…

Яндекс осуществляет процесс нахождения всех пассажей в документах, удовлетворяющих этим ограничениям, с учетом оператора нечеткого поиска с неявно назначенным коэффициентом «мягкости» [8]. Коэффициент мягкости (число от 0 до 100) задается при помощи следующего синтаксиса:

(несколько слов с контекстными операторами)//МЯГКОСТЬ

-теперь понятно, что это за число после //. Хотя по их дальнейшим графикам это скорее жесткость. Проверить на выдаче.

Оператор AND сильно сужает область поиска с каждым новым термином. Применение AND к запросам с большим количеством терминов (более 5) приводит, как правило, к пустому списку найденных документов. Оператор OR, наоборот, расширяет область поиска с каждым новым термином. Применение OR к запросам с большим количеством терминов (более 5) приводит к длинному списку найденных документов. По этой причине: а) неоправданно расходуются ресурсы компьютера, б) длинный список найденных документов труднее адекватно ранжировать.

-таки еще раз… В колдунщике никаких операторов OR нет, там только AND на расстоянии в несколько слов или предложений… Откуда берется OR? 1) либо это было “для поиграться” на РОМИПе, либо 2) видимый нами колдунщик не есть правильный либо 3) OR – это AND с расстоянием в 7 предложений вперед-назад. 🙂

Идея кворума в поиске не нова, ее аналогом в процедуре фильтрации релевантных пассажей можно считать принцип «weighted coordination match» [9], при котором «найденными» считаются все полные пассажи, а также все неполные, сумма весов слов которых превосходит необходимый кворум

-ну понятно, веса написаны в переколдованном запросе… Итак, одно редкое слово может перекрыть много частых. Только не написано, кворум этот самый – он тоже индивидуально рассчитывается для каждого запроса (логично было бы) или жестко установлен от числа слов в запросе? Судя по дальнейшему изложению, могут играть оба варианта – кворум то в словах, то в процентах нарисован… Или мягкость меняется от запроса?

QuorumWeight=(1-Softness)^((ЧислоСлов-1)^-1/2)

-собственно, жестко от числа слов, а мягкость они ставят неизвестно как… Не дочитал. Пока не проговоришь, не поймешь.

при Softness=50 число найденных документов должно быть примерно средним геометрическим чисел найденных документов при поиске всех возможных неполных пассажей

-Как это, softness же в интервале (0,1)…??? Наверное, число за // на 100 делится…

В частности, при равных по весу словах запроса и коэффициенте мягкости 0.06 (того, что использовался при выполнении заданий РОМИП), в пятисловном запросе достаточно 4-х слов (или 76% веса), а в 16-словном всего лишь 8 слов (или 52% веса) для преодоления кворума.

-говорили, 6 – стандартная мягкость…

Формула для вычисления веса слова при голосовании по кворуму отличается от формулы, используемой при ранжировании.

-каком еще голосовании?

Если при ранжировании Яндекс использует классический для IR логарифм обратной частоты, то при вычислении суммы голосов в кворуме применяется степенная функция с показателем между квадратным и кубическим корнем. Отличия состоят в том, что «вариант с корнем» больше ориентирован на учет “тяжелых”, “редких”, “новых” слов, пусть и без полного набора соседей, тогда как логарифм тяготеет к максимальному возможному количеству слов в пассаже независимо от их тяжести

-видимо, это относится к расчету суммарного веса пассажа для сравнения его с “цифиркой” -кворумом… Или, может, не так – сумма весов это, типа, весь кворум, а степенная функция – это голос одного слова… Но на кой это надо… Перечитать.

После того, как все пассажи документа, прошедшие фильтрацию по кворуму, определены, наступает этап ранжирования, то есть вычисление веса документа.

-только по прошедшим границу…

Внутри-документная частота по релевантным пассажам

Формула расчета веса слова по отношению к документу («контрастности») в Яндексе использует внутри-документные частоты слов с учетом этапа фильтрации. Иными словами, в классической формуле SUM(TermFrequency*), вычисляющей вес документа по отношению к запросу как сумму контрастностей слов запроса в документе, в Яндексе используется заниженная TF, учитывающая только те словопозиции, которые попали в «интересные» нам пассажи. Фактически Яндекс считает полностью «нерелевантными» все словопозиции слов запроса, не удовлетворяющие контекстным ограничениям.

-т.е., частоты учитываются только по словам, попавшим в пассаж, т.е., стоявшим достаточно близко с другими словами запроса. Поэтому и оптимальной частоты может не сущаствовать.

Ранжирование на уровне словопозиций: расчет веса словопозиции

Полученная контрастность слова распределяется на все его позиции, прошедшие фильтр.

-контрастность – это что, то, что мы при “голосовании по кворуму” получили для слова или что?

Затем по ним происходит итерирование и вычисление веса каждой словопозиции с учетом расстояния до всех остальных слов из запроса, попавших в пассаж. Учет состоит в вычислении сходства этого расстояния с заданным в запросе оптимальным расстоянием.

-таки идет некий возврат к исходному, незаколдованному запросу…

Наконец, веса словопозиций, взвешенные по сходству их полного контекста, «собираются» обратно и образуют вес документа.

-“Собираются”… 🙂 В шпиёны надо было пойти, однозначно. Складываются? Умножаются? 🙂

Расчет веса словопозиции позволяет максимально точно учесть сходство пассажа и запроса. При этом выигрыш получит документ, у которого более «тяжелые», смыслоразличительные слова окажутся в контексте, более похожем на контекст в запросе

-дык.

Функция контрастности

В классической литературе по IR можно встретить разные функции нормирования и сглаживания внутри-документной частоты при вычислении контрастности TF*IDF.

-а, вот она, контрастность. Сначала употребили термин, а потом его объясним. 🙂 Получается, это какая-то переколдованная частота.

Функция Яндекса, подобно функциям Harman и BM25, нормализует внутри-документную частоту по размеру документа.

-что бы это значило… Судя по ссылкам, функция Яндекса похожа на (12) и (13)…

Следует отметить, что в Яндексе используется дополнительный анализ текстов при индексировании для подавления многократного повторения слов в тексте в расчете на повышение ранга документа в выдаче поисковых машин [8].

-о! Ага, ясно, что с учетом всех хитрвы#####ых алгоритмов преимущество получили бы тупые перечисления запросов в дорвеях… 🙂 Главное – правильно подобрать их количество и расстояние между ними…

Функциям весов пассажей, описанным в литературе:

Присущи следующие общие черты:

• Объемлющие пассажи игнорируются

• Позиции внутренних опор не принимаются во внимание

• Ранг неполных пассажей строго меньше ранга полных

• Вес пассажа — плавно убывающая функция, обратно пропорциональная длине (или корню длины) пассажа и его «неполноте»

В функции Яндекса (табулированный набор коэффициентов) также соблюдаются некоторые их этих принципов, в частности, принцип деградации неполных пассажей. Схожим выглядит и убывание при уменьшении сходства с оптимальным расстоянием.

-ага, ну с дефективностью неполных пассажей как-то все уже знакомы, а вот какой контекст используется?… Функция Яндекса – “табуированный” 🙂 набор коэффициентов.

Яндекс использует учет форматирования при ранжировании дважды. При вычислении контрастности слова используется информация о вхождении его в выделенные области текста (заголовки и т.п.). Кроме того, на этапе вычисления веса пассажа, пассажи, полностью попавшие в некоторые зоны документа, получают дополнительные баллы

-таки есть учет, что бы нам не говорил semaster в рассылке А&П 🙂

Яндекс также анализирует форматирование на этапе индексирования

-интересно, на кой? Разве что дорвеи и спам вычислять.

Для Веб-поиска мы вручную выбрали «лучший» вариант из 8-ми: два вида ограничения контекста (предложение и документ), с группированием или без группирования по хостам. Коэффициент мягкости брался в одном случае равным 6 (значение по умолчанию), а в другом — 10. Для нормативной коллекции выбиралось лишь лучшее контекстное ограничение, а группирование не имело значения. Вариант синтаксического преобразования запроса за нехваткой времени испробован не был.

Лучшим вариантом для обеих коллекций мы посчитали: «документный контекст, отсутствие группировки, мягкость 6».

-хе-хе! “Отсутствие группировки по сайтам” был лучше! 🙂
***
Одно непонятно – а чегой-то они так подобрели? Надо бы еще было коэффициенты выложить…

От тех, кто не дорос до продвижения

В форуме Searchengines появилось объявление о работе от некоего Sam (который недавно интересовался индикатором тИЦ).
Объявление называется так: Для тех, кто перерос “оптимизацию”. В частности, там есть слова типа “не запятнавший себя подписанием Кодекса”. (Ссылка сам Кодекс).
Андрей Иванов даже по этому поводу написал разъяснения.
Мне бы со своей стороны хотелось бы попытаться перевести на более понятный язык некоторые требования к потенциальным сотрудникам – перевод вольный:

Требования к работнику	Перевод на русский
– опыт поисковой оптимизации от 2-х лет	Ну не можем же мы сказать, что лохов набираем!
– опыт внепоисковой трафикогенерации	Навыки накрутки счетчиков, iframe-трафик и программы-кликеры
– опыт медиапланирования	Сначала счетчики на сайте накрутим, а потом будем впаривать клиенту имиджевую рекламу
– английский желательно без словаря	Будем заниматься партнерками в англоязычной порнухе – в словаре таких слов не пишут!
– кругозор в области интернет-маркетинга	Будешь ходить по улице – оглядывайся по сторонам!
– опыт (желание, возможность, стремление) руководства коллективом	Нужно набирать реферралов – таких умников, как ты сам
– не запятнавший себя подписанием Кодекса…	Нужен дорвейщик и спаммер
Фрилансеров просьба не беспокоить!	Зарплата $150 в месяц на полный день плюс уборка офиса

-все совпадения случайны 🙂

дорвейный спам от А до Я

Модерируя свою доску по обмену ссылками, наткнулся на забавный сайт: http://www.alpinist.nm.ru/ – особенно нижняя часть страницы интересна.
Перечислены запросы, видимо, из Директа, под видом глоссария. Ссылки, правда, ведут на одну страницу (прайс) – это губит идею.
А вообще идея интересная, можно развивать. 🙂

Дорвеи и учет цифр в запросе Яндексу

Скачал и пробил по запросам дорвейный сайтец http://fardek.front.ru . Человек использовал “подход” – на каждый запрос сделал 3 типа дорвеев.
Что интересно – по всем запросам вылезает “первый”, самый простейший тип дорвея.
Но только для запросов вида “Нокия 1234” – всегда вылезает третий тип. Может ли это быть связано с каким-то иным способом учета чисел в запросе, отличным от учета слов? Вероятно.
Версию о падежах не предлагать – все дорвеи использовали только одну форму словосочетаний.
Позиции вот такие:

fardek.front.ru : http://www.yandex.ru/
Запрос|место Thu Sep 16
17:06:25 2004
BIOS скачать 1
бесплатно скачать клипы 2
библиатеки в сети скачать детская литература научная 1
Doom 3 скачать 10
DVD кодек скачать 2
GTA скачать 3
карта Москвы скачать 2
камасутра скачать 5
Miranda скачать 1
мультики скачать 5
Nero скачать 2
ПДД скачать 2
порно фильм скачать 6
порно скачать бесплатно 10
Putty скачать 1
скачать аську 7
скачать ACDSee 13
скачать бесплатно книги 4
скачать Doom2 1
скачать Doom3 3
скачать эротические игры 13
скачать фильм Ночной дозор 4
скачать Flash Player 7 3
шрифты скачать 8
скачать ICQ lite 10
скачать книгу Ночной дозор 3
скачать mscomm32.ocx 4
скачать Mirc 6
скачать Mozilla 5
скачать нарды 1
скачать Norton Utilities 4
скачать Opera 8
скачать полифонические мелодии >20?
Style XP скачать 1
скачать Warcraft 2 1
скачать Winamp 5 2
Ума Турман Ночной дозор скачать 1
Zone Alarm скачать 1
альтернативная музыка >20?
армянская музыка 10
арабская музыка 10
бесплатно музыка >20?
бесплатная mp3 музыка >20?
Дом музыки >20?
электронная музыка >20?
где скачать музыку 6
халявная музыка 5
качать музыку 20
музыка для мобильных >20?
музыка для nokia 17
музыка для сотовых >20?
музыка для телефонов >20?
музыка из фильма Ночной дозор 1
музыка из игр >20?
музыка из кинофильмов >20?
музыка mp 3 4
mp3 музыка бесплатно >20?
mp3 скачать бесплатно музыку 18
Ночной дозор музыка 5
новая музыка >20?
новинки музыки 7
O Zone музыка 2
программы для создания музыки 3
послушать музыку >20?
поиск музыки >20?
популярная музыка >20?
поп музыка >20?
прослушать музыку 2
рок музыка >20?
русская музыка >20?
скачать бесплатно музыку >20?
скачать клубную музыку 2
слушать музыку >20?
скачать музыку без регистрации 2
скачать музыку mp3 >20?
турецкая музыка 8
транс музыка 14
зарубежная музыка >20?
игры для Нокиа 11
картинки для Нокиа 3
клуб Нокиа 1
мелодии для Нокиа 3310 2
мелодии для Нокиа 7
мелодии Нокиа 2
мобильные телефоны Нокиа 6
музыка для Нокиа 1
Нокиа 1100 4
Нокиа 2100 7
Нокиа 3100 13
Нокиа 3200 6
Нокиа 3310 >20?
Нокиа 3650 12
Нокиа 5100 5
Нокиа 5140 2
Нокиа 6100 13
Нокиа 6220 3
Нокиа 6230 13
Нокиа 6260 1
Нокиа 6510 11
Нокиа 6600 13
Нокиа 6610 19
Нокиа 6610i 1
Нокиа 7200 4
Нокиа 7210 19
Нокиа 7250 10
Нокиа 7610 3
Нокиа 7650 10
Нокиа 8210 18
Нокиа 8310 16
программы для Нокиа 6600 2
полифония для Нокиа 1
полифонические мелодии для Нокиа 1
сотовые телефоны Нокиа 2
Aura fate of the ages прохождение 1
Aura прохождение 1
Братья пилоты Обратная сторона Земли прохождение 2
Братья пилоты прохождение 2
Broken Sword 3 прохождение 2
Черный оазис прохождение 2
Черное зеркало прохождение 3
Готика 2 прохождение 3
Готика прохождение 2
коды и прохождения >20?
Mafia прохождение 1
Мафия прохождение 1
Обитель тьмы прохождение 2
Петька 3 прохождение 3
прохождение Alias 1
прохождение Arcanum 1
прохождение Fallout 2 3
прохождение Fallout 4
прохождение Gothic 2 2
прохождение GTA Vice City 3
прохождение Half Life 3
прохождение игры Гарри поттер и узник Азкабана 1
прохождение игры Князь Тьмы 1
прохождение игры Painkiller 2
прохождение игры Сибирь2 2
прохождение игры Sacred 1
прохождение игры В тылу врага 1
прохождения коды 11
Путешествие к центру Земли прохождение 3
прохождения к играм >20?
прохождение Max Payne 2 1
прохождение Neverwinter Nights 5
Периметр прохождение 2
прохождение Post Mortem 1
прохождение Сибирь2 1
прохождение Splinter Cell 2
прохождение Siberia 2 1
прохождение Suffering 1
прохождение Syberia2 2
Власть закона прохождение 1
анимация для мобильных телефонов 2
аксессуары к сотовым телефонам >20?
база данных телефонов 11
бесплатные картинки для телефонов 2
барахолка сотовых телефонов 4
драйвера для телефонов 13
форум мобильные телефоны 8
коды телефонов городов 1
как выбрать телефон 13
Казанский вокзал телефон 1
лучший мобильный телефон 16
мелодии для сотовых телефонов LG 8
мелодии для сотовых телефонов Nokia 20
модели телефонов >20?
мобильные телефоны оптом >20?
мобильные телефоны Panasonic >20?
мобильные телефоны Philips >20?
найти адрес по номеру телефона 2
обои для сотовых телефонов 6
описание мобильного телефона Samsung x100 2
описание телефонов >20?
полифонические мелодии на телефон >20?
продам мобильный телефон >20?
прайс на сотовые телефоны 8
продам сотовый телефон >20?
программа телефон 11
разблокировка телефона 12
софт для мобильных телефонов 11
сравнить мобильные телефоны 1
сотовые телефоны с фотокамерой 9
сотовые телефоны Simens 9
телефоны Екатеринбурга 5
телефоны Иркутска 3
телефон Курского вокзала 2
телефоны Новосибирска 5
телефоны Петербурга 5
телефоны раскладушки >20?
телефон с АОН >20?
телефоны звезд 5
выбор телефона >20?

А вот попробуем поискать нокиа по сайту fardek.front.ru – сплошняком лезут те самые “третьи версии” довеев:

fardek.front.ru/nokia/nokia82103.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia6610i3.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia72003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia11003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia31003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62303.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia21003.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia51403.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/nokia62203.html (4 КБ) — строгое соответствие
fardek.front.ru/nokia/mnokia3.html (4 КБ) — строгое соответствие

Действительно, может, число в запросе как бы “меньшую роль” играет. Нечто среднее между присутствием слова и отсутствием числа.

Август 2026
Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Фев
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31