Penguin – бесплатная программа для подбора ключевых слов + база на 200млн. кейвордов

XS
На сайте с 31.01.2014
Offline
54
#51

Удаление дублей происходит при использовании оперативной памяти, таким образом размер файла ограничен размером Вашей оперативной памяти.

Есть 2 варианта удаления дублей: быстрый но лимитированный, и медленный, но не лимитированный. Во втором случае надо сравнить все строки со всеми, а это значит, что на файл размером 45 гигабайт нужно произвести примерно миллиард миллиардов операций, что ровно в миллиард раз больше, чем производится при фильтрации. А это значит, что такой файл будет обрабатываться около миллиона лет. Кстати такой алгоритм используется при поиске вхождения строк друг в друга, и если попробовать обработать им такой файл, то он напишет Вам сколько точно займет по времени такая обработка.

Как удалять дубли, советы:

1. Удаляйте дубли в конечных выборках, это займет пару лишних минут.

2. Если файл отсортирован по алфавиту, то можно проверить есть ли там в принципе дубли, как правило не бывает, но если база собрана самостоятельно то другое дело.

3. Если файл отсортирован, разбить его на части размером меньше чем Ваша оперативная память, удалить в каждом куске дубли, затем открыть все эти файлы, произвести выборку без условий, чтобы они объединились и сохранить уже с нужным именем.

4. Самый лучший: Сделать выборку по первой букве по регулярному выражению во включениях типа "^a", "^б" и т.д. по каждой букве, затем проделать все действия, описанные в третьем пункте.

По поводу ICQ: я использую 2 аськи (ICQ и QIP), обе можно найти здесь. Писать лучше именно на ICQ 66-три-84-семь-900, так как QIP отличается тем, что очень много сообщений туда не доходят. ICQ доступно постоянно и отвечаю моментально.

Sevix
На сайте с 24.10.2011
Offline
73
#52

Сделайте, пожалуйста, возможность применять условие:

#слово+#слово

и комбинации (# до или после)

А то так много ненужного вытягивает.

XS
На сайте с 31.01.2014
Offline
54
#53

Принял Вашу идею. Возможно реализую в следующих обновах. Довольно хорошая концепция.

XS
На сайте с 31.01.2014
Offline
54
#54

Пингвин обновлен до версии 5.3. Внесены следующие изменения:

  • Добавлена возможность подключать файлы с условиями в списки включений и исключений, что позволяет задавать десятки тысяч условий, если это нужно.
  • Добавлена возможность при групповой фильтрайии в разные файлы выбрать режим распределения включений: либо проверять включения для каждого файла независимо, либо до первого совпадения.

До конца месяца действует скидка 40%, промокод: B9069F28F4BE49E1

Купить, как укажите промокод, не забудьте нажать кнопку "Использовать"

N
На сайте с 21.01.2016
Offline
6
#55

Скачаю вечером вашу программу,попробую ее в деле

5P
На сайте с 15.03.2010
Offline
125
#56

X-Software, писал в асю пару дней назад, но ответа не последовало

напишу здесь

для выборки по файлам можно добавить функцию что бы НЕотфильтрованные кеи складывались тоже в какой нибудь файлик отдельно, плз

и что бы можно было выбирать эту фишку галочкой например

›› CBD Partners (https://u.to/j-WKFw)
XS
На сайте с 31.01.2014
Offline
54
#57

Пишите в аську 663 восемь четыре семь 900, она постоянно активна. Идею нужно обсудить детальнее.

S7
На сайте с 13.11.2011
Offline
45
#58

Появилась задача очистить много дублей строк из разных файлов.

Перебрал тонну всякого софта. Времени потратил - несколько дней, а очищено от дублей не было даже половины.

И тут вспомнил о старом добром Пингвине. Решил попробовать.

Результаты небольшого эксперимента:

22 файла общим объемом 82Гб

Уникальных строк - 1,2Гб.

Ресурсы компа: 2Гб оперативы, 2 проца.

Результат - 1 файл, весом 1,2Гб. Потраченое время - 2,5 часа!

Я думаю, результаты говорят сами за себя.

R
На сайте с 16.01.2012
Offline
62
#59

X-Software, предлагаю добавить быструю очистки списка ключей. Сейчас есть 2 кнопки - "добавить файл с кейвордами" (зелёный плюс) и "открыть кейворды" - в обоих случаях файлы добавляются, если в рабочей области программы уже есть какие-то строки.

Нужна кнопка что-то вроде "очистить поле ввода" или по кнопке "открыть кейворды" именно открывать файл (а не добавлять его содержимое).

Мемори
На сайте с 11.11.2012
Offline
105
#60

действительно толковая программа, еще бы клиент-серверную или веб 2.0 версию

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий