Сервис удаления дублей фраз

Y7
На сайте с 17.05.2005
Offline
146
1044

В связи с тем, что Кей Коллектор не ищет неявные дубли фраз без учета словоформ, подскажите каким сервисом пользуетесь?

Как найти дубли в 20 тыс фраз типа таких:

простатит
простатита
[mAveRik]
На сайте с 09.11.2006
Offline
124
#1

как вариант: http://py7.ru/tools/norm/

1. выбираете "Привести морфологию"

2. В "Сортировать строки*" выбираете "Не сортировать, удалить дубли"

3. Вставляете список запросов и жмете нормализовать

Продвигаю сайты, консультирую, 7 лет опыта, двигал крупные ecommerce (/ru/forum/994817)
Y7
На сайте с 17.05.2005
Offline
146
#2

[mAveRik], спасибо, но проблема в том, что нужно найти дубли, а потом на основе их оставить самый частотный.

https://ppc-help.ru/del_duplicate такое делает, но он дублями считает синонимы. что не очень автоматизирует.

[mAveRik]
На сайте с 09.11.2006
Offline
124
#3

вам нужен частотный словарь?

тогда делаете нормализацию и потом сюда http://py7.ru/tools/keycnt/

A1
На сайте с 25.06.2013
Offline
94
#4

если правильно понял задачу

я использую yadz.ru для этого

Создаем проект, загружаем ядро из файла, далее во вкладке будет группировка по морфологии, оттуда можно отминусовать и посмотреть наиболее часто встречающиеся

хотя мне казалось кей-коллектор тоже умеет показывать эти дубли по морфологии

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий