Программа для поиска и удаления дублей в контенте

D
На сайте с 11.10.2007
Offline
66
580

Ребят, подскажите какую-нибудь программу (под Windows) для следующих целей:

Есть 2 массива, в одном массиве 2000 значений, во-втором 10000 значений. Все перемешаны каким-то случайным образом. Необходимо из второго массива удалить все те значения, которые встречаются в первом. Иначе говоря аналог Поиска и замены во всех редакторов только со множеством выражений.

Чтобы засунуть в прогу из файла исходные 2000 значений и посмотреть файл с 10000 значениями на присутствие дублей.

Нашел программу Advanced Find and Replace, но она нормально работает до 1000 значений, а после жутко тормозит.

Или подскажите, как это сделать в Excel (наверняка какой-то способ есть), в субботу вечером голова совсем не варит :(

Заранее благодарен.

Etorg (www.etorg.ru)
sabotage
На сайте с 14.02.2007
Offline
192
#1

Две колонки, данные-фильтр-расширенный фильтр.

S2
На сайте с 07.01.2008
Offline
611
#2

TextPipe Pro Evaluation. Добавляете файл. Затем включаете фильтр "удалить строки из списка" и указываете в качестве источника 2-й файл. Чистил базу в несколько миллионов строк - результат был через пару минут. Впрочем это попробуйте.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий