re: подсчитать в тексте частоту употребляемых в нем слов и словосочетаний

[Удален]
1211

Однажды мне написали:

Вот возникла задачка, посмотрите, может будет интересно закодить.

Нужно подсчитать в произвольном тексте частоту употребляемых в нем слов и словосочетаний произвольной длины и вывести эти словосочетания по частоте употребления в тексте или по (частота употребления в тексте)*(число слов в словосочетании).

Максимальное число слов в словочетании можно сделать настраиваемым. Минимальное число - 1 слово, очевидно.

Особенность такой реализации - именно произвольная длина словосочетаний. Думаю такая простенькая программка многим будет полезна.

Что скажете?

Получилось так:

http://tools.hod.ru/cgi-bin/word_rating.cgi

На странице сервиса всё описано - что учитывает, что нет.

Конечно, аналога Яндекс или Гуглу в плане русской морфологии и стоп-слов создать очень затруднительно без сильного финансирования, но и применённые механизмы не самые слабые.

Ранее, я уже говорил:

Если что нужно, утилиты какие, сервисы, не стесняйтесь, пишите личкой. Буду реализовывать на досуге.

Теперь мне выдали кусочек интернет пространства, где можно видеть и пользоваться всем, что реализовано, и описать всё что требуется:

http://tools.hod.ru/

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий