Построение частотного словаря по тексту

IK
На сайте с 24.03.2016
Offline
33
1854

Добрый день

Посоветуйте пожалуйста программу/сервис, которая бы помогла решить следующую задачу.

У меня есть десятки тысяч строчек текста типа:

бульдозер komatsu d65ex 16 цена

бульдозер komatsu d65ex 16 купить
бульдозер komatsu d275 2016 года
komatsu д155ах 5 бульдозер

Также, у меня есть база стоп слов, типа

цена

Купить
года
2016

Мне нужна программа/сервис, которая бы:

1) Построила Рейтинг используемых слов (Базовый функционал)

2) Сгрупировала бы похожие слова в одни группы (Было бы круто)

3) Очистила список от тех слов, которые есть в стоп словах

Спасибо

Удивительно
На сайте с 07.07.2009
Offline
215
#1

Это, конечно же, МегаЛемма - http://www.amazingsoftware.ru/megalemma

Она делает в точности то, что вы описали, и многое другое

Качественная семантика недорого ( https://moab.tools/ )
Z0
На сайте с 03.09.2009
Offline
756
#2

Key Collector все это умеет... ;)

Focky
На сайте с 09.06.2013
Offline
80
#3
ziliboba0213:
Key Collector все это умеет... ;)

да, кк со всем этим справится

Покупаю ссылки с качественных сайтов строительных тематик. Рассмотрю любые варианты. Личка.
S
На сайте с 27.12.2007
Offline
114
#4
IK
На сайте с 24.03.2016
Offline
33
#5
Удивительно:
Это, конечно же, МегаЛемма - http://www.amazingsoftware.ru/megalemma
Она делает в точности то, что вы описали, и многое другое

Программа и правда очень удобная, НО за 8 часов построения частотного словаря, так ни на процентик не сдвинулась

Ради эксперимента, запустил на 4600 ключевиках, он за минут 20 вроде бы построил результат.

Но как быть, когда куча запросов

Удивительно
На сайте с 07.07.2009
Offline
215
#6

Программа, к сожалению, не работает с большими массивами. Оптимальная производительность - 15-20 тыс ключевиков. См. документацию.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий