Депозит как-то странно себя вел последние несколько дней... поначалу ошибку какую то выдавал по ссылке, явно системную, потом вроде все норм стало, а сейчас удален.... не понять :)
Перезалил. Ссылка в подписи.
Спасибо! Работаю для вас :)
По поводу отзыва: еще есть 2 лицензии со скидкой 50% :)
По поводу ПС: проблема только с баном айпишника, не очень хочется делать задержку между запросами до 30 сек - проверка 1 текста займет много вреимени, а если их 500 .....
Обновление до версии 1.0.6
Ссылка в подписи.
Ссылка в подписи есть. Версия 1.0.4.
Обновление до версии 1.0.3
Добавлен выбор режима отображения результатов: таблица или файл (для большого количества текстов)
Ссылка для скачивания Text Analyzer
Вторая лицензия со скидкой продана.... осталось 3 :)
Прокси очень нестабильная штука и очень мало анонимных - проблемно с ними: проверять постоянно, искать и т.д. А они обошли наверное потому что знают лазейку и никому об этом не скажут, это точно :)
У меня есть чекер Google PageRank и там как раз есть формирование хитрого запроса, со всякими там контрольными суммами - эту штуку не банит хоть сутками крути:) А вот как на поисковик так сделать я не знаю... :(
Пробовал делать подобную штуку. Проблема с банами. Если ставить задержку, то времени понадобиться очень-очень много... вариант пробоя капчи рассматривал - не очень охота возиться... если подскажете как обойти бан - постараюсь прикрутить.
не совсем понял о чем идет речь... парсинг поисковиков?
Обновление программы до версии 1.0.2
Полный функционал, включая версию 1.0.2:
[Версия 1.0.1]
1. Исходные данные:
1.1. Сравнение текста с эталоном
1.2. Сравнение текстов в двух направлениях
1.3. Сравнение списка файлов с эталоном
1.4. Сравнение списка файлов в двух направлениях
1.5. Сравнение списка файлов с отбором по критерию уникальности
2. Настройка выборки шинглов
3. Учет фактора морфологии (функция Левенштейна)
4. Стемминг (процесс нахождения основы слова для заданного исходного слова)
5. Корректировка содержания:
5.1. Удаление русских символов
5.2. Удаление английских символов
5.3. Удаление цифр
5.4. Удаление знаков пунктуации
6. Копирование выбранных файлов из списка результатов обработки в указанную папку
[Версия 1.0.2]
1. Изменение размеров шингла (3-20)
2. Автоматическая корректировка текста:
2.1. Удаление стоп-слов
2.2. Удаление служебных символов
2.3. Процедурная обработка текста при помощи скриптов. Позволяет очистить текст
практически от всех лишних символов, включая теги
2.4. Очень гибкая настройка
2.5. Утилита для создания скриптов «Script Editor»
3. Сохраняемые профили настроек для выполнения сравнения в несколько кликов
4. Импорт форматов *.doc, *.rtf, *.htm, *.html, *.mht
5. Расширенный просмотр результатов:
5.1. Отображение всех шинглов текста
5.2. Отображение совпавших шинглов
6. Значительно ускорен алгоритм обработки
Тестовое сравнение: режим - сравнение в двух направлениях
количество файлов - 500
объем файлов - 2000-2500 символов
алгоритм - «Advanced»
произведено сравнений текстов - 249500
время работы - 70 секунд
сравнение производилось по всем шинглам текста
Получить демо-версию программы для ознакомления можно написав мне на почту: soft_icecore[at]mail.ru или скачать с депозита: http://depositfiles.com/files/luc1m8lty
Осталось 4 акционных лицензии со скидкой 50%
Любые вопросы и пожелания в асю или по почте.