Удивительно

Удивительно
Рейтинг
215
Регистрация
07.07.2009

У него даже ник такой

Барыгу на кол 777 раз :)

1 страница уже в индексе

Это потому, что тут засветил :)

spambot:
что вы там намудрили?

Намудрили много чего :)

BlackEvil:
Нужно поработать над скоростью и тогда будет очень нужная вещь:)

Над скоростью работаем, все покупатели получат обновления.

200k кеев на моём Athlon 64 4200+ 3Гб ОЗУ чистятся 4 часа - не так уж и долго

Ставите на ночь полную обработку - утром готов результат

vegasnax:
купил базу кеев по датингу и адалт кеи, так вот адалт кеи ещё нужно прочистить хорошо. мало стоп-слов у вас, есть и бесплатное и ДП и много чего, а так за такую цену нормально.

если не трудно - скиньте в личку, что вы там нашли

правил очистки очень много, но не спорю - может быть что-то пропустили

заранее спасибо 🍻

booch:
Там основные инструменты конечно есть, но они все базовые, а хотелось бы добавить более продвинутые инструменты, например облегчённые аналоги каких-нибудь платных программ.

Например вот сейчас в соседнем топике удивительно продаёт софт по очистке кеев от мусора, можно думаю сделать нечто подобное, только онлайн и бесплатную.

У меня есть онлайн-вариант KeyPro. Но в массы его продвигать нельзя - из-за регулярных выражений создается колоссальная нагрузка на сервер - ни один VDS не понянет при количестве пользователей больше одного. А без регулярок скрипт не имеет нужного функционала и становится бесполезен.

http://amazingsoftware.ru/load/thank/you/KeyProInstaller.zip

Пробуйте на здоровье :)

За отзывы буду очень признателен.

================================================

Немного о функциях, которые планируется добавить в ближайший месяц. Все они будут использоваться для обработки списка ключевиков на вкладке "Результат" - до или после обработки основными функциями.

1. Поиск и замена - найти в списке строку ХХХ и заменить её на строку YYY (с поддержкой рег. выражений)

2. Удалить строки, которые содержат строку ХХХ (на лету, чтобы не добавлять правило и не запускать обработку еще раз, с поддержкой рег. выражений)

3. Добавить в начало строки - добавляет строку ХХХ в начало строки

4. Добавить в конец строки - добавляет строку ХХХ в конец строки

5. Добавить после NNN слова - добавляет строку ХХХ в после слова №NNN

6. Сделать первую букву большой

7. Сделать все первые буквы большими

8. Сделать все буквы большими (перевести в верхний регистр)

9. Сделать все буквы маленькими (перевести в нижний регистр)

10. Сделать большой N-ю букву слова №M

11. Перемешать слова в строке

Все операции, перечисленные выше, будут происходить со всеми строками, или с выделенными - как выберете.

12. Фильтры:

12.1 по количеству слов

12.2 по вхождению подстроки (с поддержкой рег. выражений)

12.3 по невхождению подстроки (с поддержкой рег. выражений)

13...

14...

15...

...

{дальше секрет ;)}

Релиз программы будет существенно ускорен - планируется распараллелить обработку ключевиков на несколько независимых потоков, что ускорит работу в несколько раз. Также есть идеи по улучшению интерфейса и удобства использования программы.

В общем, ждём вас, уважаемые дорвейщики в нашем интернет-магазине!

Тем более, что цена вроде бы не кусается ;)

Не забывайте, что вы покупаете не только программу, но и пожизненные обновления и техподдержку!

У каждой программы свои достоинства и своя эпоха :) egis уже перестал развивать свой софт, а мы только начали. KeyPro вобрала в себя все функции egis'a, улучшила их и обзавелась своими.

По порядку:

1. Русские слова с английскими буквами (и наоборот) не удаляются, а корректно заменяются буквы (зачем удалять всю строку, если можно просто заменить букву?)

2. Удаление мусора из строк - строки не удаляются совсем, а очищаются от мусора (зачем удалять всю строку, если можно просто удалить из неё мусор?)

3. Работа с результатами обработки, удобное добавление правил, логирование, сохранение логов

4. Поддержка регулярных выражений в правилах - теперь не нужно перечислять бесплатно, бесплатная, бесплатное, бесплатные, а достаточно лишь указать бесплатн[а-я]{0,} и будут удалены все словоформы

5. Функция объединения нескольких файлов в один.

6. Программа не виснет во время обработки больших файлов (используются потоки) и чётко сообщает о прогрессе работы

7. Готовый список правил для очистки (350 правил для удаления мусора из строк и почти 1,5 тысячи для удаления строк. С учетом многих использованных регулярных выражений размер списка по факту больше в несколько раз). Поддерживается удаление по полному вхождению слова или по частичному (если в правиле указано полное вхождение, то, например в кейворд mailзнакомства удален не будет, а если частичное - то будет).

8. Чёткий план развития программы на ближайший месяц - будут добавлены порядка 50 функций по обработке строк, благодаря чему программа превратится в универсальный строковый комбайн.

9. Бесплатные пожизненные обновления программы и списков правил

В общем, мы очень старались и вроде получилось неплохо :)

Оценивать, конечно, вам, а мы пошли дальше работать - на подходе скрипт синонимайзера, который обрабатывает 10мб текст за 3 минуты... Нет, даже за две...

Спасибо за отзыв!

Как и обещал, вышла программа для профессиональной очистки ключевых слов KeyPro. Подробности на этой странице, там же скриншоты и покупка. Обсуждение в этом топике. Цена - 29$, пожизненные обновления.

Приобрел базу в дополнение к своей коллекции.

У меня есть написанный мной скрипт, который проводит аудит баз синонимов, вычищая их от всякого мусора. Так как собираю я базы давненько, то и скрипт уже отлажен очень хорошо. Мусором он считает:

1. Несоответствие времен, падежей, родов (например, мир нельзя тупо заменить на вселенная, так как мир мужского рода, а вселенная - женского). Скрипт распознаёт эту грамматическую информацию, сравнивает и, если она не совпадает - удаляет строку из словаря.

2. Кроме того, скрипт удалил все совпадения слов, синонимов, слов в синонимах и синонимов в словах.

3. Также скрипт удалил все строки, где слова и синонимы представлены двух-, трехсловными (и более) словосочетаниями (мой синонимайзер их не поддерживает, да и добавить морфологические формы к ним автоматически не получается).

4. Скрипт объединил купленную у VkVetal базу с моей, пропуская имеющиеся совпадения (опять же, слов, синонимов, слов в синонимах и синонимов в словах).

Скрипт трудился 8(!) часов.

Результат таков: к моей базе прибавилось 160 тысяч новых строк (всего вышло 260 тысяч). Количество замен, естественно, возросло, но читабельность ухудшилась в несколько раз (проверил на пяти разных текстах). Встречаются курьезные вещи (Карл Маркс кушал прав - в словаре кушал=был).

Вывод: база VkVetal неплоха, но еще есть, над чем трудиться. Дело не в количестве слов и их форм, а в их качестве. Со своей базой базу VkVetal пока объединять не буду - слишком уж ГС получится на выходе (ГС - говносинонимайзер).

Оплатил свою десятку, домены в примечании указал, DNS потом пропишу

Всего: 2564