Технологии определения тональности документов

123
W
На сайте с 23.09.2004
Offline
40
#11
Слава Шевцов:
Не уверен, но подозреваю, что тональность для факта (или личности) может быть определена с точностью до простого предложения, где он (она) упоминается. Не больше, но и не меньше.

На самом деле, не стоит надеяться, да и не нужна 100% (и даже 80%) качество распознавания мнения.

Для многих задач хватит стандартной классификации по близким контекстам, если текстов много.

Если же текстов мало - все бесполезно. Но при этом и ценность отдельной оценки сомнительна.

VT
На сайте с 27.01.2001
Offline
130
#12
На самом деле, не стоит надеяться, да и не нужна 100% (и даже 80%) качество распознавания мнения.

В общем-то, да. Для моих задач важно находить и распознавать кризисные коммуникации, а это очень небольшой (но самый важный) процент информационного потока.

Если же текстов мало - все бесполезно. Но при этом и ценность отдельной оценки сомнительна.

Тексты - это сырье, которое перестало быть проблемой.

Top for the good
На сайте с 16.02.2008
Offline
322
#13

Почитайте алгоритмы поисковых систем, точнее гугла, если Вы внесете в свой анализ дополнительно ранжирование и оценку документа, то может и получите, что хотите, отсекая шум и используя модели приведенные выше.

Мастер модель практически нереализума. ИМХО

Чем вам помочь в SEO продвижении или юзабилити сайтов?
(https://topuser.pro/) Увеличить доход от РСЯ и AdSense (https://topuser.pro/uvelichit-dohod-adsense/)
VT
На сайте с 27.01.2001
Offline
130
#14
Почитайте алгоритмы поисковых систем, точнее гугла, если Вы внесете в свой анализ дополнительно ранжирование и оценку документа

Да я, в общем, в этой области (IR) уже более 8 лет, и знаю, как это работает у них. Проблема в том, что частотный анализ не годится для тональности - вещь уж больно субъективная.

Поэтому здесь интересны свежие идеи.

rypy
На сайте с 06.02.2007
Offline
33
#15
Зарабатывай на биржах: Sape (http://www.sape.ru/r.2ab646a8f2.php) и Miralinks (http://miralinks.ru/users/registration/from:4923). Автоматизируй продвижение - Seopult (http://seopult.ru/ref.php?ref=0915826a962409ce). SEO в картинках (http://seopics.ru)
VT
На сайте с 27.01.2001
Offline
130
#16
Хорошие новости, плохие новости.

Не похоже, чтобы все это на сайте делал автомат.

Top for the good
На сайте с 16.02.2008
Offline
322
#17

Стер, что-то флуд развожу.

rypy
На сайте с 06.02.2007
Offline
33
#18
Vyacheslav Tikhonov:
Не похоже, чтобы все это на сайте делал автомат.

Не автомат, конечно же, но я счел ссылку косвенно относящуюся к теме.

Жаль, что проект забросили, судя по всему. Идея-то неплоха.

none_smilodon
На сайте с 11.08.2006
Offline
12
#19

проблема в данном случае такая: ирония, итд не всегда віделяется даже человеком. можно пойти по словам-маркерам, демаскирующим признакам, создать дерево решений, систему анализа контекста или заняться нейронной сетью. в любом случает, качество решения будет ниже чем результат обезьянки за клавиатурой. если конечно обезьянка не очень тупа.

я понимаю, что если есть заказ ві не будете заниматься предсказанием потенциальных трузатрат и сравнением с другими решениями. но задача на первій взгляд весьма нетривиальна.

VT
На сайте с 27.01.2001
Offline
130
#20
в любом случает, качество решения будет ниже чем результат обезьянки за клавиатурой. если конечно обезьянка не очень тупа.

Проблема в том, что набрать столько обезьянок, которые бы оценили в течение часа поток из нескольких тысяч документов, нереально. Нужно программное решение.

я понимаю, что если есть заказ ві не будете заниматься предсказанием потенциальных трузатрат и сравнением с другими решениями. но задача на первій взгляд весьма нетривиальна.

Обычно чем сложнее задача, тем интереснее ее решать. Здесь точно есть какая-то фишка, лежащая в области психологии, а не информационных технологий. Например, средняя длина слов в тексте меньше, если хвалят, и больше, если ругают. :)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий