clues.yahoo.com – ассоциации, демография, EN

послушал видео Павла Браславского (Яндекс) про классификацию поисковых запросов (следующих еще несколько там)

упомянут сервис http://clues.yahoo.com/ – по словам куча данных, жаль только англоязычные и часть слов выпилена.

пример – mortgage
1. пол и возраст
2. другие популярные запросы по выборке (“From age 25 to 34, popular queries with men searching for mortgage were”)
3. распределение по географии (интересно, нормировано на общую посещаемость или как)
4. SEARCH FLOW – предшествующие запросы и последующие запросы. Круто.
5. ну и собственно связанные запросы

спам: а яндексу можно, типа?

яндекс предупреждает о заражении в письменном виде

Теперь уведомления рассылаются всем, чей сайт подвергся атаке злоумышленников.
***
Адреса доставки уведомлений – указанные в whois или стандартные общепринятые технические адреса (например, webmaster@, admin@, support@)

-это ж боян, такой спам уже давно ходит. Типа ааа, ваш сайт заражен.
а Яндекс считает, что ему то же самое можно, это типа не спам, если от яндекса.))

Каждое письмо содержит ссылку на отписку от уведомлений

-ага, у спамеров тоже содержит.

уязвимости Яндекса

Яндекс открыл конкурс – Месяц поиска уязвимостей Яндекса

Яндекс уделяет большое внимание вопросам безопасности данных своих пользователей. С целью популяризации информационной безопасности в интернете, мы объявляем месяц поиска уязвимостей — предлагаем всем желающим попытаться найти уязвимости в сервисах Яндекса. Победитель получит $5000.

В течение месяца мы будем принимать сообщения об обнаруженных уязвимостях и 25 ноября 2011 года на конференции по информационной безопасности ZeroNights подведём итоги конкурса.

-у меня, кстати есть уязвимость, которая позволяет с любой страницы любого ЧУЖОГО сайта узнать логин посетителя, если тот залогинен в Яндексе. Может, и еще что-то, глубже не копал. Проверил – работает.

Это считается уязвимостью или нет? нужно кому-нибудь? 🙂

нужны помощь или советы: побороть медленную заливку в mysql

+ завел тему на серче

Есть много данных, и они заливаются. Но с некоторых пор все стало тормозить. Как бы это побороть?

Что имеется.

* Имеются таблицы, в каждой примерно 1М строк на сейчас, рассчитываю, что будет в разы больше. Но плохо уже сейчас – заливается медленно.

* средняя таблица сейчас:

Данные 436,174 KB
Индекс 79,469 KB

* таблица такая по ключам:

CREATE TABLE `sell_urls` (
`su_id` bigint(20) unsigned NOT NULL auto_increment,
`f_sd_id` bigint(20) NOT NULL default ‘-1’,
`su_url` varchar(255) NOT NULL,
****много полей
PRIMARY KEY (`su_id`),
UNIQUE KEY `f_sd_id` (`f_sd_id`,`su_url`)
) ENGINE=MyISAM DEFAULT CHARSET=cp1251 ROW_FORMAT=FIXED;

* в конфиге mysql, как я понимаю, не должно быть ничего интересного? Key_buffer_size=4G

* mysqld при работе насасывает памяти до 30% (от 24G!!!) – не знаю, важно это или нет.

* заливка происходит из файлов через выполнение команд mysql -u -p dbname < file.sql
В этих файлах лежат запросы вида:

INSERT INTO sell_urls(f_sd_id, su_url, список полей) VALUES (список наборов значений от 1 до 100), (), ()… ON DUPLICATE KEY UPDATE параметр1=IF(параметр2>=VALUES(параметр2),параметр1,IF(параметр1=0,разные значения)), параметр=VALUES(параметр), ….. ;

Много используется этих IF-ов при обновлении.
Т.е. в зависимости от того, что лежит в таблице, происходит перезапись других полей либо нет.
Перезаписываются поля, по которым индексов нет.
Запросы в одном файле полностью относятся к одной таблице, не к разным.
Причем если одни insert, то летает очень быстро, а если update – медленно

* select запросов одновременных к этим таблицам нет вообще.

И все это медленно работает.
Причем на маленьких таблицах работает быстро. Я сначала думал, что это из-за всяких этих IF-ов, но раз на маленьких быстро – наверное, не из-за них?

Сначала еще я сменил ROW_FORMAT на FIXED, потерял на размере, вроде побыстрее стало, но все равно таблицы увеличились и стало медленно.

Что посоветуете сделать?
Разбивать таблицы на маленькие уже не хочется – эта таблица с 1М записей и так одна из 100 после разнесения.

наиболее взламываемые CMS

Яндекс опубликовал немного статистики по топам сайтов вообще и топам взломанных сайтов.
Так-то понятно, что это фактически "взламываемость" в среднем по больнице, только Яндекс постеснялся ее так прямо называть.
Очень жалко, что нет числовых данных. Тогда можно было бы разделить "популярность взломанных" на "общую популярность", чтобы прикинуть отношение.
В комментах попросили учитывать криворукость админов. Понятно, что это не выйдет. Но вместо этого можно было бы учесть айпишники этих самых 10 тыс. топовых сайтов (по топу взлома и популярности). В том смысле, что можно посчитать аналогичную статистику, но с гарантированно разными айпишниками. Это дало бы приближенную к реальности картину по разному железу – более вероятно.
Тогда взломы устойчивых ЦМС через взлом сервера через один из аккаутнов (одну из ЦМС) на сервере – были бы в бОльшей степени исключены.

буки не про переоптимизацию выложили?

http://webmaster.ya.ru/replies.xml?item_no=11658

Тестируйте новую формулу ранжирования для московского региона
Мы подобрали новую формулу ранжирования и предлагаем ее протестировать на buki.yandex.ru. При подборе использовались новые оценки асессоров и новые факторы. Основные изменения в ранжировании касаются коммерческих сайтов московского региона. Будем рады увидеть ваши отзывы и замечания.

Но потом сами яндексоиды откомментировали, что:

Эта версия алгоритма не имеет отношения к переоптимизированным текстам.

Странно. Значит, сначала отдельные изменения "для коммерческих сайтов московского региона"…

ох, какую я тему пропустил ) как бдбд пыталось вернуться…

тема от 10 числа: БидеБиде жжот))
Короче, санкциям два месяца и терпение кончилось. Бдбд в роботсе переклеило свой домен на домен www.bizvdkuat.ru – там и копия сайта лежит.
Сейчас того роботса уже нет, но в яндекс-баре клей показывает:
http://bar-navig.yandex.ru/u?ver=5&show=32&url=http://www.bdbd.ru/

<urlinfo>
url domain="www.bizvdkuat.ru">/</url>
yaca url="www.bizvdkuat.ru"/>
***

Переклейли, а санкции не переклеились. На день вылезли, чо. Интересно, кстати, что на 5 место – пониже, чем раньше.

Короче, бдбд теперь бизвдкуат 🙂

PS А, нет, тот роботс еще есть на домене с ввв – http://www.bdbd.ru/robots.txt

User-agent: Yandex
Disallow: /*?
Disallow: /competitiveedge/
Disallow: /print/
Disallow: /users/
Disallow: /webforms/
Host: www.bizvdkuat.ru

посоветуйте м.б. не просто игровую партнерку, а именно игру?

Это экспериментальная задача, так что можно не постить рефки – это вопрос ограниченного времени и денег.

Значит, стоит задача – я привлекаю трафик (более-менее целевой, но абсолютно нетаргетированный, например: контекстная реклама по точному запросу "!игры"), и нужно найти игру, которая будет нормально конвертиться. Причем есть пожелания к партнерке.

Я так понимаю, что игры бывают –
* типа ВОВ, скачиваемые с установкой на комп, многопользовательские
* браузерные, многопользовательские (это называется "онлайн-игры", так?)
* браузерные, однопользовательские, простейшие (это называется "казуальные игры", так?)

конвертация – допустим, регистрация.

***

1. По конвертации – я рассчитываю на 10-50% конверсии. НЕ БОЛЬШЕ 50%. Я просто не знаю, какого размера бывают конверсии в этой теме (пример – трафик с КР по "!игры"). Основная моя задача – повышать конверсию, т.е. нужно место, куда расти. Можно предварительно пользователей пугать чем-нибудь, ну там – платностью игры, чтобы не сильно много конвертировались.

2. По партнерке – хотелось бы максимальную статистику – по регистрациям, по баблу пришедшему, и самое хорошее – отдельно по пользователям. Т.е. не просто чтобы общее количество регистраций и бабла, а по юзерам конкретно (чтобы я мог понять, по какому запросу человек пришел и на какую версию сайта он попал).

3. Ну и отдельные игры из пула игр партнерки – какие-то лучше или хуже? Какие-то не особо примелькались?

Можете что-то посоветовать?

или в теме на серче

вольности при платном принятии в Я.Каталог

С удивлением обнаружил, что при ПЛАТНОМ добавлении в ЯК редактор сам переписывает по-своему текст ссылки и описания. Удивился несказанно. Ну и раздел выбирает, но это ладно.

Полез в оферты и убедился, что там так и написано:

Описание – составленное сотрудниками Яндекса описание информационного ресурса (сайта) в сети Интернет, включающее название такого сайта (полное или сокращенное), содержащее гипер-ссылку на такой сайт и характеризующее его содержание в соответствии с требованиями Правил.

Блин, а на какого тогда требовать введения текста ссылки и описания? Создается впечатление, что текст должен быть ровно тот же, добавленный.

Кстати, по первому разу promosite.ru в ЯК не взяли за "поисковый спам". После того, как я удалил метатегом несколько статей, которые выводились по группе запросов типа "как создать свое дело", сайт взяли. Там для иллюстрации списки запросов тематические были )) Вроде как для людей, но если в ЯК добавиться, вообще топ1 небось был бы, а им не хотелось 🙂
===
А кто мониторит ЯК? Видели какое описание у БДБД? Когда оно поменялось?

"Bdbd.ru" – услуги интернет-рекламы и маркетинга
Организация комплексных рекламных кампаний в интернете; анализ, оптимизация и продвижение сайтов в поисковых системах. Информация об агентстве. Статьи.

Что-то мне сомнительно, что они сами составили такое описание, где нет в ссылке ничего про продвижение сайтов. Кажется, что у всех топовых буквально был фрагмент типа "САЙТ.РУ – раскрутка и продвижение сайтов". А тут как будто специально нужные слова вычистили из текста.

Прошлись и переписали описания у всех? Или только БДБД мочат по всем фронтам?

добавления в апометр

в апометре http://tools.promosite.ru/updates/ добавления – начал писать и показывать текстовые комментарии к апдейтам (сейчас есть 9 июля). не знаю, как их дальше писать и откуда брать.

юзерам, что ли, позволить камменты писать. Так мата не оберешься )) Или вип-группу какую нить сделать.

второе – начал таки показывать какую-то цифирь про апдейты той части поведенческих факторов, которые берутся из учета кликов по выдаче. Метод простой (спасибо за наводку Стасу:) )) Смысл цифири – когда выдача с учетом кликовых ПФ апдейтится сильнее, чем без них – цифирь больше 50%, максимум 100. Смысл – слабые изменения запроса, когда по сути выдача должна быть такой же, но в явном виде люди такой запрос не набирают. Когда обе выдачи апдейтятся одинаково сильно – цифирь примерно равна 50% и не показывается. Сейчас есть ап 17 мая, когда выдача с ПФ апнулась сильнее, чем без них.

сегодня в 13 запланирован мой рассказ про апометры и тд. на мегаиндексе (ссылку на анонс дать невозможно, бгг), фотография какая-то странная только.

в виджет и рсс пока не вставлено, потом вставлю.