Cognitive продала Яндексу синтаксический анализатор

Cognitive продала Яндексу синтаксический анализатор
Интересно, какая основная цель – определение авторства (первоисточника) или борьбе с генеренными текстами (марков, синонимизаторы). Или извлечение фактов из текста?
Но я не очень верю, что получится что-то хорошее. Умных технологий можно придумать много, но на объемах текстов рунета они "не шмогут".
Значит, упрощения рулят. Надо про это почитать ))

Компания Cognitive Technologies объявляет о продаже (предоставление права использования за вознаграждение) компании «Яндекс» Программного Комплекса, включающего в себя возможности синтаксического анализа текста.

Синтаксический анализатор позволяет определить, какими синтаксическими отношениями связаны слова предложения. Это может звучать неожиданно, но для понимания текста эта информация гораздо важнее, чем значение отдельных слов. Потеря знаков препинания в классической фразе «казнить нельзя помиловать» приводит именно к потере однозначности синтаксических связей.

Использование синтаксического анализатора для больших корпусов текста позволяет определять и изучать статистические закономерности языка (встречаемость слов и конструкций). Такого рода закономерности могут быть использованы, в частности, при разрешении неоднозначностей (например «ключ упал на пол» и «в камнях забил ключ»), возникающих во время синтаксического разбора, а также при построении статистических моделей языка для распознавания слитной речи. Стоит отметить, что возможность разрешения неоднозначностей является одной из важнейших характеристик, отличающих лингвистические технологии разработанные Cognitive Technologies.

Применение синтаксического анализатора также позволяет проводить сравнение текстов на основе встречаемости в них различных слов и конструкций и разрабатывать методы понимания текстов, извлечения данных из текстов, а также другие приложения.

На основе данного программного комплекса компанией Cognitive Technologies создан ряд интеллектуальных программных продуктов, например системы определения авторства и стиля документа.

via

Какие нынче есть автопродвигалки?

Автоматические. Хочется их типа независимо протестировать.

Что я знаю:
1. Сеопульт
2. реинкарнация Реактора – rookii
3. Вебэффектор
4. на Мегаиндексе вроде автопродвигалка есть, письма шлют про нее
5. Маремото не считаем по двум причинам (одна из них – что он не со всеми запросами работает)

Еще какие-нибудь есть?

Релиз ненарисованный

у меня сегодня http://tools.promosite.ru/ шторм выдачи 42% без текстового апа.

Не заорало про релиз, потому что приучено на следующий день после апа не показывать, надо заново обучить (зато в виджете показывает, см.)

Но не только ашмановский апометр показал, но и сеоьюз написал, что типа что-то сообщили из источников. Про текстовое ранжирование.

Весь день представители поисковой системы не комментировали ситуацию, но сегодня выяснилось, что изменения объясняются обновлением части алгоритма, связанной с текстовым ранжированием. «Изменения могли повлиять на ранжирование страниц, содержащих тексты, предназначенные в первую очередь не для пользователей, а для влияния на поисковую систему», – уточнили в пресс-службе Яндекса.

Кстати, вчера перетрясло ладно – вчера еще текстовый апдейт был. Я-то про сегодня.

Блин, надо бы сегодня вывалить всем смотреть ежедневную анализировалку, но там в ней сложновато лазить )

Так в среднем – изменения более выражены по длинным запросам (степень изменения выдачи увеличивается от 20% для однословников до ~50% для 5-6 словных запросов), т.е. я верю в то, что расколбас коснулся текстового. Но и еще разного другого мог коснуться. )) Пойду втыкать дальше.

приехал с горных лыж

ездили со 2 января (сейчас вернулись) с горнолыжной школой сноупро в Кампителло, Италия.

катание – круто, куча трасс (суммарная длина трасс всего района 1200 км), в основном красные и черные.

Основная фишка – "sella ronda" – круговой маршрут вокруг горы, тоже длинный, часов 4-6 занимает (все это спуски плюс подъемники, в обе стороны проходится).

Скачиваю фотке, обошел дозором владенья – вроде разрушений нет, компьютеры железные обошлись без смазки. Вроде ничего не сломалось, если сломалось – ругайтесь в почту!

с меня фотке.