ищется программка для поиска и обработки дублей слов

Димитрий
На сайте с 20.01.2007
Offline
137
518

Стоит такая задача:

Первый файл, как бы эталон ключевых слов, что уже идут в обработке ( то есть с ними работа, удалять их нельзя)

Второй файл- добавочный, в нем куда больше ключевых слов, но много дублей ( повторов из первого файла).

Нужно быстро очистить второй файл, оставив в нём слова, которых нет в первом!

пробую пока keywordkeeper 4.2.4 еще не знаю чем кончится, так как 20 минут работает при количестве слов в 7-10 тыщ.

Первый файл 7 тыщ, второй 10.

Есть ли чудо программка для такой работы, более быстрая?

Разума и осознания! Личный сайт- грани мироздания, психология и всё такое (https://geval.ru)
MIND
На сайте с 08.03.2007
Offline
238
#1

есть! сделайте это в ms access как вариант.

В одну таблицу добавьте слова из первого файла, в другую - из второго. Затем создайте запрос вида SELECT * FROM SecondTable WHERE NOT EXISTS (SELECT * FROM FirstTable WHERE FirstTable.Text = SecondTable.Text). Сделает всю работу за секунду

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
Димитрий
На сайте с 20.01.2007
Offline
137
#2

спасибо, надо попробовать, просто в access никогда не работал.

SeVlad
На сайте с 03.11.2008
Offline
1609
#3
Нужно быстро очистить второй файл, оставив в нём слова, которых нет в первом!

:) Попробуй взглянуть ширше :)

Нужно не очистить второй файл, а что? Наверняка - из этих двух файлов получить все уникальные строки. Такая же стоит задача?

Т.е. нужно а) объединить 2 файла и б) удалить дубликаты строк.

Для этого можно заюзать тот же keywordkeeper, а можно любой (наверное) правильный текст. редактор (Акелпад например). Ну или тот же Эксель.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
P
На сайте с 25.05.2007
Offline
103
#4

http://maulnet.ru/tools/lists# вкладка "вычитание" делает ровно то, что вам нужно.

coolakov.ru/tools (http://coolakov.ru/tools/): определение конкурентов (http://coolakov.ru/tools/most_promoted/), кластеризация запросов (http://coolakov.ru/tools/razbivka/) и т.д.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий