Яндекс – дубликаты или бан?

Из доменов:
TRIADA.RU
LASKA.RU
MADEIN.RU
METALS.RU
SRAVNI.RU
В Яндексе находятся только страницы TRIADA.RU. Остальных сайтов нет. На добавление TRIADA.RU, METALS.RU, LASKA.RU отвечает “Сайт внесен в нашу базу” На MADEIN.RU, SRAVNI.RU – запрещен к индексированию.
Вот к чему ведет тупое использование перекупленных доменов.

Зачем людям реклама в Я.Маркете

– если они ей так распоряжаются?
В свое время, когда я открывал торговую систему по ноутбукам и звал туда магазины, я пробежался по Яндекс-Маркету и позвал тематических к себе.
Сегодня наткнулся на то, куда именно они ведут своих посетителей с Маркетовой рекламы.
Примеры: Магазин Метак-М.
1) http://www.metakm.ru/view.php?note_id=27060&ynd=1 -хорошо запрятана ссылка на покупку?
2) http://www.metakm.ru/acc_txt.php?ac_id=23133&ynd=1 – пример менее изысканной товарной страницы, попроще – для крестьян.
3) http://www.metakm.ru/acc_txt.php?ac_id=31274&ynd=1 – ну нет у нас такой информации, чего пришел? 10 центов нам не жалко.
Ссылки взяты из фида.

Если бы я был поисковой системой,

… я бы сдвигал параметры “текстовой” оптимальности страницы в завистимости от цитируемости (ее самой или морды сайта).
Представьте: оптимизировали сайт, получили результат по менее конкурентным запросам, двигаетесь дальше – наращивете ссылки на себя – и проваливаетесь на фиг.
Страшно, а? 🙂

Масяня is back

Новость, правда, устарела немного. 24 сентября – Кассационная жалоба по опротестованию решения суда о возврате прав Олегу Куваеву возвращена заявителю в связи с тем, что он не имел право ее подавать.
И так далее.
http://www.mult.ru/projects/mas/mults/mult_80.html

Редиректы в Yahoo

Только что заметил. При поиске “всех страниц с домена” в Yahoo вылезают редиректы.
Пример: domain:yaca.yandex.ru – все редиректы после второй страницы считаются как будто бы они на сайте Яндекса!
При этом редирект 301, урл яндекс-каталожный, а тайтл – от целевого сайта!
Интересно, учел ли Яху эти ссылки? Вроде да, из категорий ЯК ссылки нашлись: link:xttp://www.tnk.ru domain:yaca.yandex.ru (при этом первая ссылка – опять якобы с домена yaca!).
Чушь получается. Он что, считает редиректную ссылку и ссылкой, и страницей на ссылающемся сайте одновременно?
Хотя может, все проще – бага языка запросов.

Умение писать

… как-то мимо меня проходит. А ведь надо.
А то все гоним посетителей, а что с ними дальше делать – пусть заказчик думает. Т.е., теоретически они покупать должны, а практически все ограничиваются перечислением характеристик товара. Ну от силы телефон хорошо видный будет на сайте.
Хотя для “овеществленных” товаров оно не так уж важно, может быть. Хотя и там надо какое-то понятие дать о характеристиках товара. Простенькое. Для чайников. Но чтоб заметили и прочитали.
А чтобы услуги продавать? Нужнее. А чтобы всякие программы – еще нужнее. (вы все еще скачиваете логи? тогда мы идем к вам 🙂 )
А чтобы отчеты или рассылки платные – вообще никак, это ведь читателя еще убедить надо, чтобы он это купил.
Идея, в общем-то, проста – “Что Тут Есть Для Меня”.
Вот примеры написания таких текстов-
http://smartresponder.ru/
http://10buttons.powerbooks.ru/ (и вообще http://powerbooks.ru/powerbooks.php )
http://bizzon.info/money/, http://bizzon.info/virus/
http://wbm.net.ru/rpg.htm (вообще перл!!!)
-вот читаю и думаю, во-первых, научусь ли я ТАКОЕ писать. Думаю, что почитать такого побольше надо.
Но не могу много такого читать. Тошнит-с.

Язык запросов Рамблера: изменения

Влад Шабанов сообщает на форуме Рамблера от 29 сентября: Язык запросов: изменения в семантике операторов.

Изменение в поисковой машине затронуло язык запросов. Основная идея — сейчас между словами вставляется некоторый “клей”, примерно как в TeX (см. книжку Дональда Кнута “Все про TeX”). Поведение – аналогичное, только вот ядро Рамблера не имеет возможности решать задачу поиска наикратчайшего пути в графе (см. главу 14).

Сейчас “снаружи” доступны следующие операторы:

a & b
— документы, где одновременно есть a и b, чем ближе, тем лучше. Фактически амперсанд здесь означает кусочек клея с некоторыми стандартными настройками сжимаемости, растяжимости и “оборачиваемости”.

a &< b a &<< b a &<<< b -- вариант оператора & с более жестким клеем. Клей &<<< совсем плохо сжимается и почти не растягивается. a &> b
a &>> b
a &>>> b
— вариант оператора & с более мягким клеем. Запрос, где слова склеены клеем &>>> ранжируется почти как && (см. ниже)

a && b
a AND b
— документы, где одновременно есть a и b, причем все равно на каком расстоянии.

a &&& b
— сайты, где одновременно есть документы, содержащие a и b, причем не обязательно, чтобы a и b были в одном документе. &&& – это еще один вид клея, который помещается уже не между словами, а между документами одного сайта.

a | b
— документы, где есть a или b, причем одновременно a и b — лучше, а уж если рядом, то совсем хорошо

a || b
— документы, где есть a или b, все равно, радом или нет, на ранжирование не влияет

(N, a & b & c …)
— ограничение расстояния между словами.

“a * b”
— буквальный поиск, * — джокер (любое слово или знак препинания). Найдет все документы, где есть a и b, причем между ними стоит в точности одно слово. Разумеется, звездочек может быть несколько.

a NOT b
— отрицание.

Операторы &&&&, |||, ||||, &<.> и так далее зарезервированы на будущее.

Пробелы, знаки препинания — это такие “волшебные” операторы, которые в зависимости от контекста заменяются на
что-то из перечисленного выше (или еще на что-нибудь :-).

Вот бы Яндекс так сообщал…
Все, иду тестить. 🙂

Перемножать или складывать?

Волнует вопрос: как учитывается совокупность параметров страницы поисковиками.
Пусть есть один параметр, например, частота слова в тексте. Пусть есть другой, например, частота слова в тайтле.
Конечно, зависимость от частоты может быть очень грубой, может быть интервал “одинаковооптимальных” значений частоты.
Но пусть есть 2 параметра (текстовых) релевантности. Скажем, “релевантность по тексту” (x) и “релевантность по тайтлу” (y).
Как они должны комбинироваться при расчете релевантности документа, имеющего и то, и другое?
Первый вариант – перемножить. Но тогда документы с нулевым значением одного из параметров будут в дауне. Если мы ориентируемся на этот вариант, надо набрать максимальное количество “разных” параметров и каждому придать ненулевое значение, а лучше оптимальное. Оптимизировать, типа.
Второй вариант – сложить. Этот вариант плох тем (с т.зр. качества поиска), что действительно релевантные документы, имеющие и то, и другое, не получают преимуществ перед документами, имеющими что-нибудь одно. Если мы ориентируемся на этот вариант, методика действий – выбрать действенный (наиболее) параметр и размножать его. Хотя это напрямую не следует.
***
Отвлечемся.
В каждом из параметров релевантности могут быть намешаны интенсивные (частота слова, f) и экстенсивные (число слов, n) величины. И экстенсивные реально есть. Поэтому тут возможна такая ситуация, что “оптимальности” нет – грубо говоря, возьми страницу в 2 раза больше с такой же частотой слова и получи в 1.89 раза больше релевантности по этому слову. И так далее, пока фантазии хватит.
По-хорошему, здесь зависимость могла бы быть чем-то вроде “колокола” по интенсивной величине, умноженное на экстенсивную величину с затуханием на некоем ее размере.
Что-то вроде:
x=exp(-(1-f/f0)^2)*[1 плюс (n-1)*exp(1-(n/nmax))]
***
Вроде как нужна комбинация первого и второго варианта. Что-то вроде:
R=ax плюс bxy плюс cy

А всю оптимизацию – на фиг, на фиг, на фиг…

Саксесс Стори.
Пришел ко мне клиент. Хороший человек. Хотел ноутбуки продавать. Ну, я ему некие цены выставил, но сказал – вряд ли вы это окупите. Т.е., я вам ничего не гарантирую, ибо тема конкурентная вроде, монстры типа Текарта там рубятся.
Ну и он предложил работать по прибыли. Я согласился. При этом на мне весь онлайн, на нем – весь офлайн.
Пока туда-сюда, я сайт делал, он базу заполнял, пара месяцев прошла. Хорошо еще, что на исходе 3-го месяца (август) продажи пошли. В августе на $1000 прибыли накапало.
В сентябре >$2000 (так-то все 70 тыс. руб., но там еще менеджеру оплата). Оборот за сентябрь – мильон рублей.
Вот и думай тут – нафиг вообще кому-то чужому что-то продвигать?
Может, на фиг всех “клиентов”? Свои магазины делать 🙂

Наконец-то придумал тему доклада для конференции

…на optimization.ru
Зарегистрировался так:
Способы создания контента сайта и организации его структуры для максимизации отдачи от поискового продвижения
Предполагается рассмотреть различные варианты структуры сайтов, предполагающие создание разнообразных страниц для индексации поисковыми системами. В основном предполагается рассмотреть интернет-магазины и коммерческие сайты. Разделы сайта, предназначенные для обмена ссылками.
Как можно наращивать “белый” контент? Создание раздела статей и классификатора, глоссария, новостного раздела, каталога сайтов, своей доски объявлений, форума, каталога сайтов. Создание и индексация страниц магазина – товарного раздела, раздела бренда, страниц товара, страниц заказа и других вспомогательных страниц. Рассмотреть вопросы разделения контента по доменам (субдоменам).