У него даже ник такой
Барыгу на кол 777 раз :)
1 страница уже в индексе
Это потому, что тут засветил :)
Намудрили много чего :)
Над скоростью работаем, все покупатели получат обновления.
200k кеев на моём Athlon 64 4200+ 3Гб ОЗУ чистятся 4 часа - не так уж и долго
Ставите на ночь полную обработку - утром готов результат
если не трудно - скиньте в личку, что вы там нашли
правил очистки очень много, но не спорю - может быть что-то пропустили
заранее спасибо 🍻
У меня есть онлайн-вариант KeyPro. Но в массы его продвигать нельзя - из-за регулярных выражений создается колоссальная нагрузка на сервер - ни один VDS не понянет при количестве пользователей больше одного. А без регулярок скрипт не имеет нужного функционала и становится бесполезен.
http://amazingsoftware.ru/load/thank/you/KeyProInstaller.zip
Пробуйте на здоровье :)
За отзывы буду очень признателен.
================================================
Немного о функциях, которые планируется добавить в ближайший месяц. Все они будут использоваться для обработки списка ключевиков на вкладке "Результат" - до или после обработки основными функциями.
1. Поиск и замена - найти в списке строку ХХХ и заменить её на строку YYY (с поддержкой рег. выражений)
2. Удалить строки, которые содержат строку ХХХ (на лету, чтобы не добавлять правило и не запускать обработку еще раз, с поддержкой рег. выражений)
3. Добавить в начало строки - добавляет строку ХХХ в начало строки
4. Добавить в конец строки - добавляет строку ХХХ в конец строки
5. Добавить после NNN слова - добавляет строку ХХХ в после слова №NNN
6. Сделать первую букву большой
7. Сделать все первые буквы большими
8. Сделать все буквы большими (перевести в верхний регистр)
9. Сделать все буквы маленькими (перевести в нижний регистр)
10. Сделать большой N-ю букву слова №M
11. Перемешать слова в строке
Все операции, перечисленные выше, будут происходить со всеми строками, или с выделенными - как выберете.
12. Фильтры:
12.1 по количеству слов
12.2 по вхождению подстроки (с поддержкой рег. выражений)
12.3 по невхождению подстроки (с поддержкой рег. выражений)
13...
14...
15...
...
{дальше секрет ;)}
Релиз программы будет существенно ускорен - планируется распараллелить обработку ключевиков на несколько независимых потоков, что ускорит работу в несколько раз. Также есть идеи по улучшению интерфейса и удобства использования программы.
В общем, ждём вас, уважаемые дорвейщики в нашем интернет-магазине!
Тем более, что цена вроде бы не кусается ;)
Не забывайте, что вы покупаете не только программу, но и пожизненные обновления и техподдержку!
У каждой программы свои достоинства и своя эпоха :) egis уже перестал развивать свой софт, а мы только начали. KeyPro вобрала в себя все функции egis'a, улучшила их и обзавелась своими.
По порядку:
1. Русские слова с английскими буквами (и наоборот) не удаляются, а корректно заменяются буквы (зачем удалять всю строку, если можно просто заменить букву?)
2. Удаление мусора из строк - строки не удаляются совсем, а очищаются от мусора (зачем удалять всю строку, если можно просто удалить из неё мусор?)
3. Работа с результатами обработки, удобное добавление правил, логирование, сохранение логов
4. Поддержка регулярных выражений в правилах - теперь не нужно перечислять бесплатно, бесплатная, бесплатное, бесплатные, а достаточно лишь указать бесплатн[а-я]{0,} и будут удалены все словоформы
5. Функция объединения нескольких файлов в один.
6. Программа не виснет во время обработки больших файлов (используются потоки) и чётко сообщает о прогрессе работы
7. Готовый список правил для очистки (350 правил для удаления мусора из строк и почти 1,5 тысячи для удаления строк. С учетом многих использованных регулярных выражений размер списка по факту больше в несколько раз). Поддерживается удаление по полному вхождению слова или по частичному (если в правиле указано полное вхождение, то, например в кейворд mailзнакомства удален не будет, а если частичное - то будет).
8. Чёткий план развития программы на ближайший месяц - будут добавлены порядка 50 функций по обработке строк, благодаря чему программа превратится в универсальный строковый комбайн.
9. Бесплатные пожизненные обновления программы и списков правил
В общем, мы очень старались и вроде получилось неплохо :)
Оценивать, конечно, вам, а мы пошли дальше работать - на подходе скрипт синонимайзера, который обрабатывает 10мб текст за 3 минуты... Нет, даже за две...
Спасибо за отзыв!
Как и обещал, вышла программа для профессиональной очистки ключевых слов KeyPro. Подробности на этой странице, там же скриншоты и покупка. Обсуждение в этом топике. Цена - 29$, пожизненные обновления.
Приобрел базу в дополнение к своей коллекции.
У меня есть написанный мной скрипт, который проводит аудит баз синонимов, вычищая их от всякого мусора. Так как собираю я базы давненько, то и скрипт уже отлажен очень хорошо. Мусором он считает:
1. Несоответствие времен, падежей, родов (например, мир нельзя тупо заменить на вселенная, так как мир мужского рода, а вселенная - женского). Скрипт распознаёт эту грамматическую информацию, сравнивает и, если она не совпадает - удаляет строку из словаря.
2. Кроме того, скрипт удалил все совпадения слов, синонимов, слов в синонимах и синонимов в словах.
3. Также скрипт удалил все строки, где слова и синонимы представлены двух-, трехсловными (и более) словосочетаниями (мой синонимайзер их не поддерживает, да и добавить морфологические формы к ним автоматически не получается).
4. Скрипт объединил купленную у VkVetal базу с моей, пропуская имеющиеся совпадения (опять же, слов, синонимов, слов в синонимах и синонимов в словах).
Скрипт трудился 8(!) часов.
Результат таков: к моей базе прибавилось 160 тысяч новых строк (всего вышло 260 тысяч). Количество замен, естественно, возросло, но читабельность ухудшилась в несколько раз (проверил на пяти разных текстах). Встречаются курьезные вещи (Карл Маркс кушал прав - в словаре кушал=был).
Вывод: база VkVetal неплоха, но еще есть, над чем трудиться. Дело не в количестве слов и их форм, а в их качестве. Со своей базой базу VkVetal пока объединять не буду - слишком уж ГС получится на выходе (ГС - говносинонимайзер).
Оплатил свою десятку, домены в примечании указал, DNS потом пропишу