Penguin – бесплатная программа для подбора ключевых слов + база на 200млн. кейвордов

X-Software
На сайте с 31.01.2014
Offline
61
28130

Penguin – это бесплатная программа, служащая для обработки текстовых файлов больших размеров (до терабайта). Под обработкой подразумевается возможность осуществления выборок по ряду условий, фильтрация этих выборок от любого мусора, сортировка, перемешивание, удаление явных и неявных дублей строк, поиск дубликатов строк, осуществление поиска, замены и т.п.

Penguin позволяет свободно открывать текстовые файлы любых размеров и просматривать их содержимое, что позволяет удобно и быстро настраивать параметры фильтров для качественной очистки содержимого файлов или выборок от всех нежелательных элементов.

Области применения Penguin:

  • Основной, но далеко не единственной, областью применения Penguin является подбор ключевых слов из баз, хранящихся в больших текстовых файлах, подобных Базе Пастухова, которые можно найти в свободном доступе в сети.
  • Так же он будет полезен, если возникает необходимость извлечь нужные данные из любого списка или файла, или очистить его от ненужных элементов.
  • Вполне возможно применение Penguin для очистки отпарсенного контента от дублей и любого мусора, что бывает необходимо при подготовке текстов под доргены.
  • Основной особенностью Penguin является возможность свободно открывать большие текстовые файлы, которые не может открыть ни один текстовый редактор. Это особенно актуально при работе с базами ключевых слов больших размеров, так как Вы можете визуально оценивать, как качество исходной базы, так и качество конечных выборок, что позволяет делать исключительно чистые выборки.

Penguin абсолютно бесплатен и может использоваться без каких либо ограничений. В дополнение он имеет расширенную верию, которая имеет дополнительный функционал, который будет расширяться с новыми обновлениями. Так же Вы можете заказывать совершенно бесплатно любые дополнения функционала под себя. Стоимость расширенной версии составляет всего 10$. При покупке расширенной версии Вы так же получаете дополнительные бонусы, на момент публикации поста – это скидка в 50% на покупку X-Parser Light.

Интерфейс программы Penguin 3.0:

Программа состоит всего из одной формы, скриншот которой Вы можете увидеть ниже. Все элементы имеют всплывающие подсказки, особо важные элементы формы имеют подробное описание их возможностей. Назначение каждой кнопки Вы увидите, просто наведя на них указатель мыши. Интерфейс прост и интуитивно понятен, так что думаю проблем с Пингвином у Вас не должно возникнуть.

Краткий видеообзор:

Какие задачи может решать Penguin:

  • Открывать и просматривать контент больших текстовых файлов (1-2000Gb).
  • Производить выборки по ряду условий из текстовых файлов любых размеров со скоростью порядка 1 гигабайта в минуту.
  • Производить фильтрацию строк или кейвордов по включениям. Т.е. задав в качестве включения слово "Скачать" Вы получите все строки, которые содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
  • Производить фильтрацию строк или кейвордов по исключениям. Т.е. задав в качестве включения слово "Бесплатно" Вы получите все строки, которые не содержат данное слово. Возможно задавать несколько включений одновременно, можно использовать регулярные выражения.
  • Производить фильтрацию фильтрации строк или кейвордов по дублям слов (в расширенной версии).
  • Фильтровать строки по длине.
  • Фильтровать строки по количество слов.
  • Удалять явные дубли.
  • Удалять неявные дубли (в расширенной версии).
  • Находить дубли. Актуально, если нужно найти пересечения в нескольких списках любых строк или кейвордов (в расширенной версии).
  • Производить поиск нужных элементов каждой строки с помощью регулярных выражений. Например можно с легкостью из списка с данными клиентов извлечь список телефонов, задав 1 условие.
  • Производить поиск-замену, как с регулярными выражениями, так и без, в текстовых файлах неограниченных размеров.
  • Производить обработку одновременно нескольких файлов.
  • Производить выборку по разным включениям, сохраняя результаты в разные файлы, получая отдельные выборки по каждому условию за 1 проход (в расширенной версии).
  • Сохранять все настройки для повторного выполнения однотипных обработок.
  • Благодаря визуализации контента позволяет удобно и быстро настраивать фильтры посредством сочетаний клавиш и контекстного меню. Например выделив слово в открытом файле и нажав Ctrl+W слово будет добавлено во включения, Ctrl+Q – в исключения. Все сочетания клавиш дублируют возможности контекстного меню, которое можно вызвать, кликнув на выделении правой кнопкой мыши.

Ссылки:


Ссылка: Скачать

Ссылка: Скачать базу ключевых слов на 200 миллионов кейвордов, 10Gb (torrent)

Ссылка: Официальный сайт

С любыми вопросами обращайтесь на e-mail: support@x-parser.ru, прочие контакты Вы найдете на официальном сайте или же в самом приложении (На форме «О программе»).

X-Software
На сайте с 31.01.2014
Offline
61
#1

Внимание! После скачивания базы кейвордов (ссылка на которую представлена в теме), перед ее использованием в Penguin удалите раздачу базы из торрент-клиента. В противном случае очень вероятно, что при открытии базы Вы получите сообщение о том, что приложение не может получить доступ к файлу.

Live777
На сайте с 23.11.2011
Offline
29
#2

Отличный софт, отличный автор софта который поддержит и подскажет, если даже софт не покупал, а используешь фришную версию.

N0
На сайте с 11.09.2010
Offline
126
#3

Купил ради удаления неявных дублей, понравилось )

Пример:

"купить что-то"

"что-то купить"

1 из них удалиться. Паршу текст x-parser´ом, выдача одинаковая по таким запросам (хоть и по разному расположены ссылки) - Penguin должен помочь мне избавиться от одинаковых страниц в дорвее )

X-Software
На сайте с 31.01.2014
Offline
61
#4

Вышло обновление до версии 3.7, внесены следующие изменения:

  • Добавлена возможность отмены/повтора последнего действия.
  • Исправлена проблема с открытием файла, если у него стоит атрибут "Только чтение".
  • Добавлена возможность получать результаты фильтрации не дожидаясь обработки всего файла. Достаточно просто остановить процесс в любой момент.
  • Исправлена проблема вывода первой строки файла при просмотре содержимого файла.
  • Исправлена ошибка, приводящая к закрытию приложения при поиске дублей строк.

Скачать обновления

X-Software
На сайте с 31.01.2014
Offline
61
#5

Внимание акция! До конца сентября 2014 года вы можете приобрести расширенную лицензию Penguin со скидкой 50%, т.е. всего за 5$!

Скидка - 50%!

Промокод акции - F7F87E0C1E4647CF

Купить, как укажите промокод, не забудьте нажать кнопку "Использовать"

Geers
На сайте с 12.04.2011
Offline
487
#6
X-Software:
Внимание акция! До конца сентября 2014 года вы можете приобрести расширенную лицензию Penguin со скидкой 50%, т.е. всего за 5$!

Скидка - 50%!
Промокод акции - F7F87E0C1E4647CF

Купить, как укажите промокод, не забудьте нажать кнопку "Использовать"

Попросите модератора переименовать тему, с бесплатная на платная.

Вводите в заблуждение серчан. Это нарушение правил.

IBakalov
На сайте с 05.10.2011
Offline
218
#7
Geers:
Попросите модератора переименовать тему, с бесплатная на платная.
Вводите в заблуждение серчан. Это нарушение правил.

Программа бесплатная http://x-parser.ru/software/9-penguin.html

Платная "расширенная версия"

X-Software
На сайте с 31.01.2014
Offline
61
#8

Программа Penguin является абсолютно бесплатной в рамках бесплатного функционала, которого достаточно для решения 90% задачь решаемых с его помощью. Бесплатный режим не является демоверсией и ни чем не ограничен. Использовать данное приложение можно сколь угодно долго.

При желании функционал можно расширить, купив расширенную лицензию. В этом случае появятся дополнительные функции, и Вы получаете некоторые бонусы, а именно:

  • Промокод на скидку в 50% на покупку X-Parser Light
  • Функцию удаления неявных дублей
  • Функцию извлечения доблей из пересекающихся списков
  • Возможность фильтрации строк с повторяющимися словами ({DoublesWord})
  • Возможность осуществлять выборку сразу в несколько файлов по условиям (кейворд:=имя_файла.txt)
  • Возможность бесплатно заказывать любые дополнения функционала
  • Возможность получать все новые закрытые функции бесплатно

Любой пользователь может использовать бесплатную версию приложения и сам для себя может решать покупать расширение, описанное выше, или нет.

M
На сайте с 23.11.2011
Offline
50
#9

Интересная программа, хотелось бы попробовать, но боязно, поскольку вирустотал ругается на майнеры.

Просветите пожалуйста, кто прав.

И еще вопрос - есть 5 выборок по 30000 значений, нужно найти все повторяющиеся перекрестные значения:

Справится ли программа с такой задачей?

X-Software
На сайте с 31.01.2014
Offline
61
#10

Да, справится с поиском перекрестных значений он может.

На счет того что ругается указанный сервис - это интересно, данный файл регулярно пересобирается с каждой обновой. Вот кстати перепроверил у меня аж 5 угроз обнаружило, как это объяснить? У тебя 2 у меня 5. Как по мне если антиварь включен, то если что-то страшное прицепиться то он угрозу ликвидирует. Ну за наводку спасибо, буду перед тем как выкладывать проверять этим сервисом, чтобы боязно не было). Сейчас поэкспериментирую.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий