Penguin [Premium Edition] - программа для подбора и кластеризации ключевых слов.

S
На сайте с 18.02.2018
Offline
8
#91

Для полей включений и исключений не хватает возможности отключить использование регулярок.

т.к иногда пингвин видит регулярки там где не надо, например в таком списке стоп-слов:

²

h+

máj

maô

k-9

61*

x+y

jîn

x/y

&me

'71

f/x

süt

.45

11.6

mamá

l.dk

léon

café

k 11

cut!

lîle

arès

Понятно что можно экранировать, но список стоп слов огромный

iskrakovrov
На сайте с 17.12.2015
Offline
92
#92

Программа маст хейв.

Так, в копилку идей... Может реально такое сотворить - работа в папках.

Сейчас можно загрузить пачку файлов и к примеру убрать дубли и все сохранить в одном. А вот если б была возможность кучку папок так же загрузить и выбрать - собрать все текстовики в одно, или сохранить дерево папок и провести работу с файлами в папках и сохранить не изменяя названия папок

Мечты))))

Мощный софт для работы c Facebook (/ru/forum/985394). Группы Facebook целевые от 500 000 человек. Консультации. Скайп и телеграм iskrakovrov
iskrakovrov
На сайте с 17.12.2015
Offline
92
#93

Программа маст хейв.

Так, в копилку идей... Может реально такое сотворить - работа в папках.

Сейчас можно загрузить пачку файлов и к примеру убрать дубли и все сохранить в одном. А вот если б была возможность кучку папок так же загрузить и выбрать - собрать все текстовики в одно, или сохранить дерево папок и провести работу с файлами в папках и сохранить не изменяя названия папок

Мечты))))

V
На сайте с 10.03.2018
Offline
8
#94
cyber1980:
Купил эту программу, закачал старые базы Пастухова (2013г). Все работает отлично и намного быстрее Кей коллектора, которым пользовался 5 лет. Самое главное преимущество и почему ее купил - это скорость работы и возможность обрабатывать гигансткие текстовые файлы. Подскажите где можно скачать бесплатно новые базы Пастухова?
п.с. Когда покупал Парсер дали 50% скидку на Пингвина :)

Парсером сделать подобное через wordstat

---------- Добавлено 10.03.2018 в 18:29 ----------

как прикрутить модуль морфологии?

---------- Добавлено 10.03.2018 в 18:30 ----------

как прикрутить модуль морфологии?

R
На сайте с 16.01.2012
Offline
62
#95

Импортирую фразы:

боксерские перчатки
боксерских перчаток
кепки
кепок
вязаные шапки
вязаных шапок

Нажимаю "найти неявные дубли с учетом морфологии", программа возвращает сообщение внизу "неявные дубли найдены", но список пуст. Только у меня так?

R
На сайте с 16.01.2012
Offline
62
#96

Также, при поиске неявных с учетом морфологии выдаёт дублями (хотя они не являются таковыми):


боксерские перчатки 10 унций
боксерские перчатки 12 унций
боксерские перчатки 14 унций
E
На сайте с 06.10.2017
Offline
23
#97

Крутая прога, давно пользуюсь) Всегда отлично справляется с большими объемами ключей! Так что рекомендую к покупке у кого ее еще нет :)

S
На сайте с 16.08.2007
Offline
93
#98

Мне тоже софт очень нравится, купил как-то давно со скидкой, сейчас активно пользуюсь. Плохо только то, что дубли из больших файлов не удалить, памяти на хватает, приходится другим софтом пользоваться.

XS
На сайте с 31.01.2014
Offline
54
#99

Вышло обновление Penguin до версии 11.7. Изменения актуальны и для Standard, и для Premium версий. Внесены следующие изменения:

  • Добавлена возможность разбивать крупные кластеры на много мелких, например если у Вас в кластере 200 фраз, а Вам нужно разбить его на кластеры по 5 фраз.
  • Исправлена операция удаления вхождения строк друг в друга.
  • Добавлен режим удаления и поиска явных дублей с учетом регистра.
  • Исправлена ошибка системы авторизации, приводящая в очень редких случаях к самопроизвольной отвязки лицензии от железа PC в Windows 10.
  • Добавлена прокрутка скроллинга на поле вывода содержимого файла.
  • В меню вставок регулярных выражений над полями включений, исключений и операций добавлены регулярные выражения для фильтрации непечатаемых символов.
  • Добавлено кодирование текста в HTML-сущности и обратно.

*************************************************************************************

Все идеи по доработкам, озвученные выше принял, в будущих обновлениях что-то из этого реализую. Если нужно что-то кому-то добавить срочно - пишите по контактам на сайте в аську, телеграм или скайп, при личном контакте я могу выделить время на обновление в срочном порядке и сделать их непосредственно под Вас и дам Вам на тест, чтобы убедиться, что все сделано корректно и так, как Вам нужно.

K
На сайте с 30.06.2016
Offline
19
#100
shax:
Плохо только то, что дубли из больших файлов не удалить, памяти на хватает, приходится другим софтом пользоваться.

А ткни пожалуйста носом, какой софт справляется с удалением дублей из файлов с большим количеством строк?

У меня примерно такой расклад... 4кк строк получается примерно 155к во всех программах, которые работают с дублями!

Приходится резать на мелкие куски, чистить на дубли, объединять и опять чистить ))

зы. Использую Penguin Premium Edition. Может это как то сделать можно проще? я не знаю!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий