X-Software

X-Software
Рейтинг
61
Регистрация
31.01.2014

Вышло обновление Penguin до версии 12.8. Изменения актуальны и для Standard, и для Premium версий. Внесены следующие изменения:

  • Добавлена обработка строк длиной более 10000 символов.
  • В меню быстрых опций добавлена обработка регистра по условию.
  • В операциях добавлена возможность замены на случайное значение по шаблону {Значение 1|Значение 2|Значение 3}.
  • Добавлен режим обработки файлов в несколько потоков, что может ускорить процесс на процессорах с несколькими ядрами.
  • Устранена проблема сбрасывания привязки лицензии на некоторых PC с Win10
  • Исправлена проблема горячих клавиш на полях включений, исключений, операций и прочих.
  • Добавлен режим максимально быстрого поиска включений и исключений на больших количествах условий.
  • Добавлен нижний порог понижения размера кластера при кластеризации в режиме режима понижения размера кластера.
  • Добавлен режим понижения размера кластера при кластеризации по условиям.
  • Добавлена возможность открытия CSV файлов.
  • Добавлено сохранение насроек кластеризации при сохраненнии проекта.
  • Внимание! При установке данного обновления, возможно, потребуется переактивировать приложение просто указав Ваши данные заново, опираясь на подсказки.



---------- Добавлено 15.01.2019 в 18:41 ----------

Killer007:
Доброго времени суток!

Вопрос такой.

Есть две базы ключевых слов

База №1
Слово 1
Слово 2
Слово 3

База №2
Слово 1
Слово 2
Слово 3
Слово 4

Можно ли в вашей программе сделать так что бы из этих двух баз осталось только слово 4
Заранее благодарю.

Откройте исходный файл для обработки, второй добавьте в исключения и в меню удаления дублей выберите пункт "Удалить точные совпадения с исключениями", это он делает очень быстро. Как раз то что Вам нужно.

Итак, давайте разберемся с поставленными вопросами:

palarmaz:
Т.е выделяю в "списке включений" ключи, нажимаю F2 - и ничего не происходит.

F2 в окне редактора как раз и срабатывает именно для выделенного текста, а не для списка выделенных строк. Вам же нужно указать Ваши условия в списке включений и в контекстном меню выбрать первую строку "Подставить к каждому условию имя файла (условие:=условие.txt)" и получите нужный Вам результат. В принципе можно добавить алгоритм, который и из окна редактора будет условия вставлять построчно, сделаю.

palarmaz:
Так же не работает функция "Удалить явно дублирующие строки":
...
Открываю файл с 9кк строками в EmEditor-е. Копирую с него же + 200к строк, получатся = 9.2кк строк. Далее в Пингвине делаю - "Удалить явно дублирующие строки" - получается итоге 9кк строк.
Почему оригинал остался?

Функцию удаления явных дублей проверил - работает корректно. По строкам: при открытии файла пингвин не читает файл целиком, а читает первые 5к строк и считает примерное количество строк, и может очень сильно ошибаться, если например в начале файла строки короткие а в конце длинные. После же каждой операции, прочитав файл, пингвин показывает уже точное количество строк. Если нужно точно посчитать строки, то нужно нажать на кнопку пересчета в виде оранжевой стрелки, которая расположена в стаусбраре рядом с количеством строк. И так же обратите внимание, что при открытии файла пингвин пишет "Количество строк (примерно)".

Sergiko:
Не смог сам разобраться, как после чистки ключей удалить все строки, содержащие менее 3 слов?

Вот скриншот с настройками для этого:

Cursor:
Долго создавал кластеры, сохранил проект, чтобы продолжить позже. После открытия этого проекта везде пусто, настройки слетели, сохранились только слова исключения. На вкладке "кластеризация" список базовых слов пустой. Думал проект сохраняется как в кей коллекторе.
Как сохранять проект без потери уже сделанного?

Смотрите, проект с кластерами сохраняется вот здесь, на вкладке кластеризации, а в меню сохраняется проект с первой вкладки, так как эти 2 модуля независимые друг от друга и настройки и результаты их никак не связаны:

Если я Вас правильно понял, то Вы можете сделать следующее: на вкладке Операции ввести "^[^ ]+ ", это удалит первые слова в каждой фразе, для удаления двух слов - "^[^ ]+\s+[^ ]+ " ", ну и по аналогии для 3-х и более слов, а затем удаляйте дубли. Таким же образом можно удалить любое слово во фразе, последнее будет так: "[^ ]+$". В целом можно добавить опцию удалить слова с k1 по k2, где k1 - позиция первого удаляемого слова, k2 - последнего. Если такой функционал нужен - напишите об этом ниже.

Акция! Покупайте до 7-го июня Penguin Premium Edition и Penguin Standard Edition, а так же X-Parser Light со скидкой 50%. Промокод акции - 4373A6B805C44417.

Jaroslav57:
Подскажите, какую операцию сделать, чтобы отчистить мусор в конце каждого ключевого слова в premium edition(например все после знака ";"): https://gyazo.com/799bfcb03a968a3ccfaab425fad9aa97 (типа ;7;3;4;5;6;8 в конце)
Но так, чтобы не удалило цифры в самих ключевых словах. Операция [0-9]+ не подходит в таком случае :(

Ну это просто: в операциях задаете ;.*$, что означает удалить любые символы начиная в точки с запятой до конца строки, и запустить.

il_cattivo:
Как активировать Penguin Standard Edition, если я не помню Доп. контакт?

Я по всем контактам всегда онлайн, пишите на все сразу, там же роскомнадзор 20 лямов IP-адресов забанил, может из-за этого на какие-то месенджеры не доходят сообщения. Или сюда в ЛС напишите, от Вас нужно только мыло или код активации если есть, так же проверьте ту ли версию Вы скачали.

---------- Добавлено 06.05.2018 в 22:37 ----------

FOX555:
У вас проблемы с сайтом. Не открывается.
Пингвин стандарт при запуске выдает ошибку (до этого пол года норм работал)
вот такую http://joxi.ru/12M94lMs4pOR82
проверил на других компах аналогичная история.
Удалял и ставил с нуля не помогло.

У ДЦ были проблемы какие-то, давно не было. Если будут повторяться проблемы такие придется переехать на другой сервер. Но обычно это разовые явления.

---------- Добавлено 06.05.2018 в 22:38 ----------

j1gs4w88:
Купил лицензию Премиум. Не могу никак активировать. Как правильно активировать?

Запустите, введите код активации, мыло и любой контакт дополнительный и все. Все просто.

---------- Добавлено 06.05.2018 в 22:40 ----------

Sevix:
А что означают цифры слева внизу, там где "Найдено строк"? Если делать выборку для одной фразы...

Он при открытии не считает строки точно, а берет первые несколько тысяч строк и считает по стредней длине строки примерное количество строк в файле. Если нужно точно, то рядом с кол-вом строк есть стрелка для пересчета. После любой операции количество строк считается точно.

---------- Добавлено 06.05.2018 в 22:41 ----------

shax:
Не могу понять как можно удалить Url, оставив только ключи? Есть список такого вида:
http://site.ru ключевое слово..

Откройте вкладку операции, и укажите условие .*?\s и запустите фильтрацию, он оставит только то что за пределами ... .

Вышло обновление Penguin до версии 11.7. Изменения актуальны и для Standard, и для Premium версий. Внесены следующие изменения:

  • Добавлена возможность разбивать крупные кластеры на много мелких, например если у Вас в кластере 200 фраз, а Вам нужно разбить его на кластеры по 5 фраз.
  • Исправлена операция удаления вхождения строк друг в друга.
  • Добавлен режим удаления и поиска явных дублей с учетом регистра.
  • Исправлена ошибка системы авторизации, приводящая в очень редких случаях к самопроизвольной отвязки лицензии от железа PC в Windows 10.
  • Добавлена прокрутка скроллинга на поле вывода содержимого файла.
  • В меню вставок регулярных выражений над полями включений, исключений и операций добавлены регулярные выражения для фильтрации непечатаемых символов.
  • Добавлено кодирование текста в HTML-сущности и обратно.

*************************************************************************************

Все идеи по доработкам, озвученные выше принял, в будущих обновлениях что-то из этого реализую. Если нужно что-то кому-то добавить срочно - пишите по контактам на сайте в аську, телеграм или скайп, при личном контакте я могу выделить время на обновление в срочном порядке и сделать их непосредственно под Вас и дам Вам на тест, чтобы убедиться, что все сделано корректно и так, как Вам нужно.

Чтобы пингвин автоматически сделал кластеризацию по 3 словам, а остаток фраз сразу же кластеризировал по 2 словам и соответственно остаток от 2 слов - по одному слову, нужно на вкладке "Кластеризация" зайти в "Дополнительные параметры" и выбрать пункт меню "Распределить фразы не удовлетворяющие базовым условиям уменьшая размер фразы". В этом режиме, если начальное условие - кластеризировать по 4-м словам, то пингвин сначала выполнит кластеризацию по 4-м словам, затем по 3-м, затем по 2-м и по одному слову. Т.е. весь "хвост" будет кластеризирован по всем возможным размерам фразы.

На счет частотности: в будущем она однозначно будет, как и работа с csv файлами, но пока на ближайшее время такое обновление на запланировано, так как это потребует переписать все базовые алгоритмы и из концепции обработки списка строк сделать концепцию обработки списка из сток, состоящих из нескольких столбцов. И при этом не потерять скорость обработки.

Вышло обновление Penguin до версии 11.0. Изменения актуальны и для Standard, и для Premium версий. Внесены следующие изменения:

  • Добавлена возможность создавать свои функции в меню быстрых операций.
  • Добавлен режим удаления дублей слов с игнорированием предлогов.
  • Восстановлена работоспособность поля операций, которая была нарушена при каком-то из предыдущих обновлений.
  • Иправлена ошибка при вычитании одного списка из другого, которая возникала при наличии нкоторых символов в обрабатываемых списках.
  • Добавлена быстрая опреация для удалить всех ссылкок на главные страницы из общего списка ссылок.
  • Добавлена быстрая опреация для поиска всех ссылкок на главные страницы из общего списка ссылок.

Такого режима обработки в ней нет, пингвин работает по принципу невнесения изменений в источник, так как изначально задуман был для осуществления выборок из файлов, а не редактирования их.

Всего: 71