сервис палева сетей, PBN, для сеошников, CPA (будущий)

Сделал выкачку всех морд в Рунете с разбором хтмл-кодов.

Нужно это как-то употребить. Рабочая версия лендинга http://helpwith.tilda.ws/codespy

Дадите новые полезные идеи, детали – что можно и хочется делать, с деталями? А я вам супер-мега-доступ в сервис.

Сейчас есть задача – определение “сетей сайтов” в Рунете (например, созданных под продажу ссылок или под сбор трафика или под дорвеи)
Они могут иметь общие параметры – кроме IP и подсети, особенности движка (строки со скриптами и meta link теги), похожесть доменных имен, софт и настройки сервера.
Однако, есть и просто парковки доменов, которые не являются сетями в этом смысле.

Есть данные – по 5.7 млн главных страниц в Рунете все перечисленное + даты создания доменов + заголовки title, Hx + число сайтов на IP + неймсервера

Кому охота поиграться с таким определением?
Если есть – то можно обсудить формат передаваемых данных.
Напишите на [email protected]

Если не хотите сами – посоветуйте методы?
kN соседей, возможно?
Байес?

КДПВ – популярность IP и Зипф со степенью -1

массовые поломки/починки апометров ) оператор date: сломался + инкрементальные апдейты Яндекса

Я, понятное дело, хоть и держу апометр http://tools.promosite.ru/ с 2008 года, но не захожу на него каждый день. И даже каждую неделю. Спасибо всем, кто написал на почту. Сейчас добавлю туда ссылку на мой FB.

Дело было в том, что с в какой-то момент новые проиндексированные документы в Яндексе перестали выводиться поиском по оператору date: (оператор даты индексации idate перестал работать еще летом).

Например: последний апдейт по оператору date был 4 декабря, а уже 6 декабря произошел ахтунг – вывалились ранее выдававшиеся документы за даты в середине, с 22 по 29 ноября:

И эта граница по старым документам (23 ноября) остается день ото дня (вот скан от 11 декабря).

При этом вы заметили, что область пустых ответов увеличилась? На предыдущем скрине пустота начинается с 29 ноября, а тут – с 4 декабря

И даже сейчас документы по запросу date:20171123 находятся, а по date:20171124 – уже нет.

И дальше – тоже нет. Точнее, совсем мало.

И такие выпадения прошлого индекса по date: происходит ежедневно и незаметно – день за днем граница сдвигается вперед. (Кстати, под это дело я поменял визуализацию, теперь там обратно отображаются документы, и чем зеленее – тем их больше)

Но иногда “отсутствующие” документы влетают обратно, 24 декабря

Но через пару дней вылетают

Теперь выводы:

  1. в Яндексе творится ниибическая хуйня. Оператор date: документирован, но работает через жопу.
  2. Вся хуйня произошла по понятным причинам. Яндекс просто дрочит на “старшего брата” дядю Гугл, у которого инкрементальные апдейты уже давно. И это все – попытка Яндекса внедрить инкрементальные апдейты, ежедневные. Это видно по поиску, да у меня есть экспериментальные сайты с ежедневно меняющимся текстом на морде.
  3. Апометр http://tools.promosite.ru/ пофиксен, все снова работает, и в отличие от других сервисов у меня таки выдается максимальная  дата проиндексированных документов. Традиция, чо. На основе поиска по экспериментальным сайтам.
  4. Прикалывает, что только 20 дек начали появляться фиксы других сервисов )) ребятки верят моему сервису, пока он молчал, они не суетились )
  5. Забыл сказать – конечно, в этом промежутке были апы. Но оператор date их не показывал.

Яндексоиды: LSI – нет, но расширение запроса – да

Многие поделились ссылкой на доклад А. Сафронова (Яндекс), где он говорит на 28 минуте, что вся пачка методов LSI-pLSI-LDA не работает (что их сигнал полезен по сравнению с BM25, но имеющееся яндексовое качество не улучшает)

А вот ссылка на другую секунду, где он говорит, что запрос расширяется дополнительными словами (слова тупо добавляются в запрос – это кстати про методы учета синонимов важно) и матчат с документом по всей пачке слов

Смысловое соответствие текстов в ранжировании — Александр Сафронов

По виду это будет вполне похоже на “сеошный LSI” (типа – напихал “хороших” слов – стало лучше), но работать должен не только на ВЧ, но и на НЧ тоже (а когда в прошлый раз с LSI по Акварели я смотрел – не работало, Чекушин говорил в комменариях на ФБ, что для ВЧ только должно работать, так кто ж их на эксперимент даст!)

Но есть еще следствия, кроме рабочести на СЧ и НЧ –

  1. вся эта штука (в докладе расширение словами) – переранжирование, динамический расчет
  2. “порядок слов в запросе”  не так уж и важен на соответствие документов, на него фапать не надо (ну, с введением релевантности типа all это и так видно было)
  3. Разные стратегии продвижения однословников, двусловников итд – ересь

Кажется, LSI в Яндексе (от just-magic, Акварель) не особо работает

Исходник на FB в группе SEO без цензуры

Действия –
* зареган домен ceramic-tile-for-bathroom.ru
* под запрос “керамическая плитка для ванной комнаты” из Акварели взят список рекомендуемых слов и фраз
* к рекомендованным словам и фразам из топа придуманы заменители и пробиты через Акварель так, чтобы эти замены были хуже основного варианта по рекомендации системы (zip, в нем xls, лист раскраска акварелью)
* на основе этих слов и фраз было сгенерено около 180 документов, в которых каждая из 38 фраз заменялась на плохую (плохие), около 5 раз для одинакового числа замен
* в php файле последовательность массивов, в каждом из них первый элемент – самый лучший рекомендованный, остальные хуже (если больше 1 элемента)
* все сгенерено в сайтик, 2 уровня структуры, 3 уровень – сами тексты, сайтмеп в роботсе, ЯВМ. Страницы последнего уровня имеют имена text-(число замен)-(список индексов массивов замен, где больше 1 элемента).html
* выкачана выдача по запросу керамическая плитка для ванной комнаты с ограничением внутри сайта

* на рисунке нарисовано число замен от позиции в выдаче

Если бы LSI от just-magic работало, в начале выдачи находились бы документы с малым числом замен хороших слов на плохие.

А в реальности – полная мешанина позиций:


Это при том, что слова на замену более “весомые” и могли бы давать фору “хорошим” вариантам

В файле 3 даты снятия позиций – 6, 15, 20 апреля

Точное вхождение запроса есть.

Вот какая была раскраска акварелью

 

Читать далее «Кажется, LSI в Яндексе (от just-magic, Акварель) не особо работает»

ссылочные апдейты сейчас странные

есть маза, что отдельно ссылочное обновляется для ссылок между доменами и отдельно внутрисайтовое.

внутрисайтовое обновилось, НПС от 18 числа, как и должно быть.

а межсайтовые НПС от 11 числа, хотя тексты анкоров переиндексированы.

наверное, нужно вводить определение двух типов апдейтов…

Викимарт-математика 2013

Йо, Викимарт молодцы
http://olymp.wikimart.ru/

Задача 1
Прогнозирование вероятности того, что пользователь сделает заказ через колл-центр

Задача 2
Прогнозирование вероятности отказа пользователя от созданного заказа

Задача 3
Прогнозирование вероятности ухода посетителя с сайта

Главное, чтоб задачи были не в формате “а теперь скажите, господа, в каком году умерла у швейцара бабушка”.
Пока есть сомнения.

умер Илья Сегалович, 1964–2013

http://clubs.ya.ru/company/69367

Аркадий Волож

Мы дружили с Илюшей со школы, четыре года сидели за одной партой. А потом вместе делали Яндекс. Сегодня ночью его не стало. Все случилось слишком быстро и неожиданно.

Последний раз он выступал перед нашими cтамбульскими ребятами в прошлый четверг. Он вышел и сказал: «Здравствуйте, меня зовут Илья». Все засмеялись, и он рассказал про поисковую платформу Острова.

Не знаю, чем можно заменить его энциклопедичность в технологиях и чистое видение продукта. Но он оставил за собой целое новое поколение программистов, целую школу. А его этические стандарты задали уровень всем нам.

Краудлимитинг ЯндексХМЛинга

Краудлимитинг ЯндексХМЛинга

***
Яндекс тут на месяц раньше против предыдущего срока решил ввести лимиты на Яндекс-ХМЛ
http://webmaster.ya.ru/replies.xml?item_no=15783
Они не будут зависеть от айпишников и то симок, а только от наличия живых сайтов, каждый их которых будет получать ежедневный лимит ХМЛ по сетке
0 – 34 – 150 – 490 – 1000 – (говорят, есть больше)
запросов в день

Если у кого есть лимиты – сайты и в них нет особой необходимости – прошу пожертвовать их лимиты для сервиса tools.promosite

* Это я прямо сейчас так спрашиваю, безвозмездно – потом внедрю всякие хорошие плюшки для тех, кто пожертововал.

Как это сделать –
1. Добавить сайт в webmaster.yandex.ru
2. Зайти в xml.yandex.ru, “начать работу”, поставить галочку “согласен с условиями” внизу страницы
3. В разделе “Информация о лимитах” http://xml.yandex.ru/limit_info.xml будет список ваших сайтов с возможностью передеть лимит
4. Пожертвуйте лимит на логин yatools на Яндексе. Тогда он торжественно появится в сервисе и я смогу желать общественно полезные запросы и давать общественно полезную инфу!!!1

——–
В акке yatools будет видно, от кого пришел лимит, в будущем это можно будет подтвердить отсылкой письма, и я сделаю хорошие плюшки ))

какие хорошие плюшки я буду м.б внедрять (все или частично) для тех, кто пожертвовал лимиты (кстати, их всегда можно забрать обратно) –

1. работа с crm.promosite.ru по некому числу запросов. Проверяет ежедневно позиции, генерит договора, отчеты, конкурентов по набору запросов, генерит готовые договора с ценами и тп, позволяет клиенту входить и люоваться на позиции и отчеты.

2. либо полный и более удобный доступ к сервисам (без капчи, пробивка пачками запросов), либо я даже чужим (свежерегам) это отключу – ну, ибо нех.

3. планировал и планирую вводить новые сервисы – там оченно много пробивки нужно будет – по входящим ссылкам на сайты по ЯВМ, по работе с базой ссылок рунета по вашему набору запросов.

4. Доска почёта на tools с перечнем хороших людей )

Но, конечно, я пока не знаю, что как будет – главное, что пожертованные лимиты остаются под вашим контролем, их всегда можно обратно отозвать.

Плиз, передайте лимиты Яндекс.XML на акк yatools

Обязуюсь все дела хранить в секрете, если нужно – никому ничо кто где чей сайт – не расскажу

buki.yandex c Островами

сами-то буки были доступны несколько дней назад, но поиск не работал.
Сейчас отдельно выложили http://buki.yandex.ru/ и http://buki.yandex.com/ – этот с Островами

1. непонятно, зачем оба выложили
2. не нашел никаких сайтов с Островами для примера