Построение частотного словаря

HJ
На сайте с 14.02.2006
Offline
274
602

Есть список заголовков статей. Более 5000

Необходимо построить частотный словарь встречаемости слов\биграмм\триграмм в заголовках.

Существуют ли готовые решения?

IBakalov
На сайте с 05.10.2011
Offline
218
#1

Для отдельных слов - копируете все 5к заголовков как единый текст и вставляете в адвего https://advego.ru/text/seo/top/, в таблице "Слова" будут как раз ваши частоты.

А вообще, была на харде софтина n-gramm-чето-там, но не вышло сейчас сходу найти.

[Удален]
#2

happy-joker, в excel штатными средствами решить можно (сводные таблицы)

разбить по словам/биграммам\триграммам можно с помощью простейшего макроса

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий