Забавный метод работы с опечатками

Нашел на сайте: http://www.yurcon.ru/error.php – люди делают "типа страницу с неправильными запросами" для продвижения по опечаткам:

" Регестрация предприятий " = " Регистрация предприятий " = 3 000руб. – 8 000руб.
" Регестрация фирм " = " Регистрация фирм "
" Htutcnhfwbz ghtlghbznbq " = " Регистрация предприятий " = 3 000руб. – 8 000руб.
" Htubcnhfwbz ghtlghbznbq " = " Регистрация фирм " = 3 000руб. – 8 000руб.

" регестрация АО " = " регистрация АО ЗАО ООО ОАО "
" htutcnhfwbz FJ PFJ JJJ JFJ" = " регистрация АО ЗАО ООО ОАО"
" htubcnhfwbz FJ PFJ JJJ JFJ" = " регистрация АО ЗАО ООО ОАО"
" регестрация А0 PF0 000 0F0" = " регистрация АО ЗАО ООО ОАО "

" Перерегестрация предприятий " = " Перерегистрация предприятий " = 6 000 руб.
" Gththtutcnhfwbz ghtlghbznbq " = " Перерегистрация предприятий " = 6 000 руб.
" Gththtubcnhfwbz ghtlghbznbq " = " Перерегистрация предприятий " = 6 000 руб.

" Лекведация фирм " = " Ликвидация фирм " = 9 000 руб.
" Ликведация фирм " = " Ликвидация фирм " = 9 000 руб.
" Леквидация фирм " = " Ликвидация фирм " = 9 000 руб.

" Часный предприниматель " = " Частный предприниматель "
" Часный предпренематель " = " Частный предприниматель "
" Часдный предпрениматель " = " Частный предприниматель "
" Чатсный предприниматель " = " Частный предприниматель "

и тут же даны разделы, куда заходить. 🙂

XSS (или не xss?) уязвимости

Навеяно этой темой форума searchengines.ru (и еще одной, где о знакомых упоминается :)).
Не знаю уж, называется ли это xss-уязвимостью, или не называется, но. Приведен пример, в котором в поиске спец. строки она вставляется в тайтл, а если туда засунуть теги (закрывающий тег тайтл, например, и хеад, и дальше ссылку), то будет ссылка с выдуманной страницы. Иногда запрос вставляется просто в текст страницы. Если есть проверка на <и> – то можно использовать UTF-7 (но не всегда: когда вставка идет в тайтл и указание кодировки идет далеко) В общем, люди вставили через поиск свои ссылки, которые качают клиентов.

Ту тему почистили, примеры:

1. Ищем в Яндексе $title(+a href http) и идем на 5-6 страницу. Видим кучу страниц, в урлах которых хтмл-код, типа http://www.cci.ru/showall.asp?t_id=1&query=%22%3E%3Ca+href%3Dhttp%3A%2F%2Finterfaks%2Ekiev%2Eua%2F%3E%E0%F0%E5%ED%E4%E0+%EA%EE%F2%F2%E5%E4%E6%E0+%ED%E0+%ED%EE%E2%FB%E9+%E3%EE%E4%3C%2Fa%3E%3Ca+alt%3D%22&page=33 . При вставке в текст страницы они дают ссылки на "клиента". Только осталось их качнуть с доноров.

2. Среди этих сайтов я нашел и сайт, который когда-то делал и продвигал – ultraslim.ru. Ссылки с него люди получают через поиск: $title(+a href http) на сайте: ultraslim.ru . Коллекция из 160 украинских (в основном!) сайтов – акцепторов. В общем, получить тИЦ 90-140 реально за счет этого метода…

3. Похожая вещь на сайте cottage.ru: #url="www.cottage.ru/search/index.php?q=*"– аж 415 проиндексированных страниц с поиском 🙂 http://www.yandex.ru/yandsearch?text=%23url%3D%22www.cottage.ru%2Fsearch%2Findex.php%3Fq%3D*%22&stype=www

4. Можно найти "заказчиков" – сайты, с которых "качаются" доноры. Надо думать, что они связаны с заказчиками… Если на странице
[убрано по просьбе beroot”> ссылка "источник" выгладит как http://www.aurore-nissan.ru/search/search.html?searchString=%22%3E%3Ca+href%3D%22http%3A%2F%2Fallautoalarm.ru%2F%22%3E%F3%F1%F2%E0%ED%EE%E2%EA%E0+%F1%E8%E3%ED%E0%EB%E8%E7%E0%F6%E8%E9%3C%2Fa%3E%3Ca+alt%3D%22 – просто качают люди доноров…

5. Реально существует около 200 известных сайтов с дырками: [убрано по просьбе beroot] – 194 сайта… Пройтись по всем и собрать коллекцию уязвимых сайтов 🙂 [убрано по просьбе beroot] Тут – 110 сайтов и т.д.

Понятно, что сделать такую ссылку проще, чем взращивать сателлит. 🙂 Прооиндексировать ее каким-нибудь фрихостом – для низкочастотки, действительно, подойдет 🙂

Литература:
http://hack-expo.void.ru/groups/antichat/html/rutxtutf7.html
http://www.securitylab.ru/analytics/274302.php
http://barushev.net/archive/2005/wordpress-xss.html
http://www.dsec.ru/about/articles/web_xss/

Переехал на движок форума phpbb

В общем, у меня давно была идея, что форматы форума и блога надо совокупить. Блог – как затравка для форума, иные люди сами пишут посты в форум "для старта" под разными никами. А блог как раз это дело заменяет.
Так что я взял, поставил себе форум phpbb (http://www.phpbb.com ), и конвертнул базу с постами блога и комментариями в форум: http://forum.promosite.ru/ , и вам нужно только восстановить пароль.
Я стараюсь "напомнить" Ваш логин и емейл, которые надо вбить для восстановления пароля. Это напоминание по куке работает с каждой страницы комментариев. А если Ваши куки стерлись, то со страницы http://blog.promosite.ru/phpbb_remind.php Вы сможете посмотреть свой логин, введя свой емейл – тогда вы будете знать, какие данные вбивать на странице восстановления пароля http://forum.promosite.ru/profile.php?mode=sendpassword .

PS Желательно свои акки обновить (а можно с них чего-нить написать), а то неактивные я сотру потом. Да, там есть глюки – некоторые юзера два раза есть, когда они два мейла вводили один за другим… 🙂

PPS Без глюков при конвертации блога в форум не обошлось – выводимое число комментов (="число ответов") на единицу меньше реального 🙂

Этот пост написан уже через форум. http://forum.promosite.ru/

Не стесняйтесь со мной связываться по мылу [email protected] 🙂 Сообщайте об ошибках здесь же в этой теме или по мылу.

Supplemental Results гугла по конкретному сайту

В блоге kass.ws пример – как посмотреть только Supplemental Results гугла по конкретному сайту.
-view – это не оператор, это “минус белиберда”. Исходный пост с примером Аарона Уолла находится здесь: View All Your Google Supplemental Index Results:

If you want to view ONLY your supplemental results you can use this command
site:www.yoursite.com *** -sljktf

Яркий пример недомема

Товарищ В.Орлов (который несколько известен в узких кругах своими обучениями на тему вирусов) имеет пост в блоге двухмесячной давности: http://consillieri.com/blogger/post_1164084156.html :

Яркий пример психовируса: контрмема-мимикрита, юзающего почти все существующие способы заражения хостов и демонстрирующий наиболее эффективный, плавно мыльнопролезающий в известное отверстие рекламный вектор среди русскоговорящих и русскодумающих

Звучит страшно, а выглядят эти 300 кило…. :))

(Сначала врубите колонки, а секунд через 20 вырубите музыку кнопарем вверху справа)

И дана ссылка на этот хваленый, пресловутый психовирус: http://vikorlov.com/tuma/
Нет, забавно, конечно. Но не фонтан, не цепляет. А главное: не распространяется нифига эта шняга. Я когда увидел пост – думаю: подожду некое время, понаблюдаю за распространением вируса. Как было с тележками к 8 марта. 🙂 Однако идея оказалась дохлорожденной – не попер вирус в массы. И не попрет.
Так что еще один камень за то, что нельзя посавить на поток производство “вирусов”. Хотя кому-то хотелось бы, и некие люди даже предоставляют услуги по созданию вирусов и обучают ньюбов этому делу 🙂 Обучать – это же не знасчит уметь.

Морфология в stat.go.mail.ru

Когда-то давно (несколько лет назад) в яндекс-статистике запросов была такая бага: при наборе любого местоимения (стоп-слова) яндекс выдавал кусок топа запросов вместо ответа. Я, конечно, сначала сграббил несколько вариантов топа, потом сообщил. Вроде, поправили тогда.
Сейчас яндекс-статсы по запросу “мыло” не дают слов (Что искали со словом «мыло» — 512646 показов в месяц пишет, а слов нет – может, проблемы в технике)…
Но вот мейл.ру извращается с морфологией настолько, что по запросу мыло в статистике запросов вылезает:

моя прекрасная няня 1378
моя реклама 1169
моющий пылесос 751
ты моя жизнь 695
моя семья 657
сериал ты моя жизнь 561
Стася – Зачем топтать мою любовь 321
мой город 306
мой мир 265

и т.д. мыло – это средний род прошедшее время от слова “мыть”, а “моя” – деепричастие, пересекающееся с “мой”. Отсюда, несколько раз морфологизируя, можно дойти от слова “мыло” до слова “мой”.
Или от слова “могут” – к слову “моча” (->могу->мочь – мн.ч. от мочи, что ли? :))
Кстати. описания сервиса http://stat.go.mail.ru/ не нашел, язык запросов хоть какой-нибудь…

Популярные движки форумов

Встала задачка выяснить, какие движки форумов наиболее популярны… Выяснил более-менее:
phpBB – 2294
“Invision Power Board” – 1700
vBulletin – 1472
PunBB – 1054 (никогда о таком не слышал)
Ikonboard – 333
***
Какие-нибудь другие популярные (в рунете) движки форумов есть? Также есть потребность (платно или бесплатно, договоримся :)) написания доп. возможностей (3 php или perl скрипта) для разных видов движков. Кто знает какие-то движки достаточно хорошо (на уровне, что что означает в базе) – прошу обращаться в очту [email protected]

Яндекс учитывает окружение ссылки?

Очередная тема на форуме: Яндекс учитывает окружение ссылки? Часть 2.. Первая часть была про тег map, после которого как-то криво весь текст до следующей ссылки попадал в индекс.
Тема о том, что по запросу anchor#link=”www.fit-pro.ru*”[различные тренажеры], где слова “различные” в ссылке нет – Яндекс:
1. Выбирает из массы ссылающихся только ссылающиеся со словом “различные” в пределах предложения:

Различные тренажеры для вашего дома. | Хатха йога – упражнения | спутниковые GPS навигаторы | рукоделие, вышивание, шитье | лунный календарь …

… ремни ликвидация оптимизация налогов Терминалы сбора данных Symbol Различные силовые тренажеры на ваш выбор. цветочный магазин, цветы продажа …

2. Не подсвечивает слово “различные” в сниппете, только “тренажеры”. Т.е., вроде как и “не находит”, но и ведь выбирает в то же время из 70 ссылающихся на www.fit-pro.ru со словом “тренажеры” только те 2, где в пределах предложения есть слово “различные”.
***
Перво-наперво я полез в reqtext – смотреть, вдруг “различные” по кворуму не обязательны. Нет, вес 27% – обязательны для двусловного запроса. Потом начал на ссылающемся сайте и другие примеры выбирать…
Действительно, взять из конца предложения ссылку и поискать с текстом другой ссылки – находит, но не все подсвечивает! anchor#link=”www.mebelproekt.ru”[Изготовление печатей && Шкафы Mr Doors, Купе]. Уже довольно глупо – учитывать текст просто соседний еще ладно, но если это ТЕКСТ СОСЕДНИХ ССЫЛОК – лажа полная получится.
Я бы считал доказательством, если бы по точному запросу в кавычках, где часть запроса НЕТ в ссылке, ссылаемый сайт находился бы как “найден по ссылке”. Но таких примеров найти не удалось. Например, “Различные тренажеры для вашего дома” – полный текст ссылки, кроме sportime.ru ничего не находим.
***
с другой стороны, я начал пробовать “поиск по тексту ссылок” оператором $anchor() – если он не “назовет” ненужное текстом ссылок, то вроде все нормально. Например, по запросу $anchor(спортивные тренажеры для дома) на 10 месте находим некий сайт, похожий на каталог:

ДК СПОРТ- спортивные тренажеры для дома – Кроненберг
Фабрика “DK-sport” основана в 1998 году. Продукция фабрики соответствует Российским стандартвм качества. Это обеспечивает надежность и безопасность тренажеров. Базовый модуль тренажеров выполнен из
www.cronenbergclub.com/catalog/?link=27 · 5 КБ

Смотрим его код – подсвеченные слова “тренажер” в выдаче вообще не являются ссылкой, а находятся на расстоянии нескольких предложений от ссылки.
С другой стороны, текст ссылки совпадает с тайтлом страницы. И выводится без болда на слове “тренажер”. Видимо, сам текст ссылки не попадает в сниппет, т.к. точно тот же текст уже есть в тайтле, и яндекс экономит на выводе одинаковых фрагментов. Такие случаи, что при пустом тайтле вместо тайтла выводится фрагмент найденного есть.
При поиске по словам из описания $anchor(тренажеры стандартвм) находим кучу сайтов, тех же каталогов, в том же виде – в качестве тайтла текст ссылки (совпадает с тайтлом), в качестве описания – описание со словами.
В общем, операторы anchor#link и $anchor() как-то размазывают… Выдают не только текст ссылок, но и окружение. Но вроде как и фильтруют по текстам одновременно. Еще пример того, что оно понимает расстояние в предложениях: $anchor(спортивные тренажеры для дома &&/3 стандартвм).
С другой стороны, примера, в котором по “левым” словам выдается сайт как “найденный по тексту ссылок” я так и не нашел. Поэтому продложаю думать, что это “пользовательская фича” для операторов поиска по тексту ссылок – расширять поиск на осн. текст. Или веса слов там как-то криво учитываются. Короче, поиск по ссылкам же для юзверя сделан, не для нас 🙂
Короче, не думаю, что поиск по текстам окружения ссылок работает. Плюс глупо юзать тексты ОКРУЖАЮЩИХ ССЫЛОК (пример выше).
PS в найденных желтым все нормально выделяет. В описании нет желтого “тренажера”.