Технологии определения тональности документов

1 23
[Удален]
#21
Vyacheslav Tikhonov:
В последнее время остро стоит задача определения тональности (позитив, негатив, нейтрал, ирония) объектов, информацию о которых несут тексты.

Острее некуда.😆

Vyacheslav Tikhonov:
У меня со всего мира идет огромный поток разнообразной информации (и на разных языках), который нужно оценить по тональности и определить, где о событии написали в негативном свете, где в позитиве.

Вот, ребята... Вот всё-всё... Или форум деградирует, или что...😮

Vyacheslav Tikhonov, может быть, делом займётесь?

Неужели сами-то люди - эксперты - точно знают тональность или "лейтмотив" того или иного мессиджа?😎

А ещё и на иностранных языках?

Ещё один Дон Кихот.

VT
На сайте с 27.01.2001
Offline
130
#22
Vyacheslav Tikhonov, может быть, делом займётесь?

Goodwin, я и делом занимаюсь, а не языком треплю. Если кому-то что-то не нравится, идет изучать форумы по разведению домашних животных. ;)

Ещё один Дон Кихот.

Штраф за флуд. Вы правы, с такими "экспертами" форум точно деградирует..

VT
На сайте с 27.01.2001
Offline
130
#23

В настоящий момент в тестовой версии мы запустили решение, которое использует следующие подходы для sentiment analysis:

* Тонально окрашенные ключевые слова и фразы бывают контестно-зависимыми и контекстно-независимыми. Первые определяются по карте рисков.

* Контекстно-независимые слова и фразы имеют конечное число состояний и позволяют задавать исходные данные для машинного обучения

* Для определения тональности важен принцип “И” - если первая фраза имеет позитивной окраску, то вторая после “И” с большой вероятностью тоже.

* Важнейшая составляющая тональной окраски объекта - наличие слов, инвертирующих тональность, части при дополнительном предикате.

* Семантическую близость окрасок можно рассчитать с помощью расстояния между объектом и термом-окраской - оно всегда стремится к 0.

* Тонально окрашенные слова вне контекста называют полярными: позитив - хороший, отличный, лучший, негатив - плохой, ужасный, худший.

* Подходы для определения термов с тональной окраской: ручной, корпусно-зависимый и на основе словарей (а-ля wordnet).

Продвигаемся дальше.

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий