Странно, так не должно быть, мы это учитывали. Проверим.
юни, честно говоря, я такие объемы никогда не пробовал, у меня даже столько текста нет :) Я проверял статьи, объемом до 9000 символов, тормозов и зависаний не наблюдалось. Но надо будет поэкспериментировать.
Да хоть каждую секунду. В том, что программа один раз нашла дубликат а второй нет ничего нет удивительного. Текст разбивается на куски и во-первых каждый раз эти куски разные а во-вторых проверяются на плагиат тоже всегда разные куски. Вот собственно и причина.
Яндекс.
Можно, но на уникальность в Яндексе.
Львович, ну тогда нужно уже целый алгоритм писать а может и словарь добавлять, что утяжелит программу. А оно надо? Ведь предназначение у программы совсем другое.
Ну, тут уж надо вручную тогда смотреть. Определить, нужные ли символы в тексте или нет программа не сможет.
Как и обещал, на странице http://textbroker.ru/main/dcfinder.html доступна новая версия DCFinder v1.02. Она сообщит вам перед проверкой о наличии в тексте латинских символов.
У меня тоже самое. Уведомления о сообщениях в личку тоже не приходят. Ящик на @gmx.de
В течение нескольких дней будет готова новая версия с проверкой текстов на предмет подмены русских символов английскими.
Я только не понимаю, причем здесь DCFinder. Что вы ему дали, то он и ищет. Дали текст, в котором половина англиских букв и он ничего не нашел, что вполне естесственно.
Ок, ок. Записал себе, сделаем. Хотя вы меня не убедили в необходимости этой функции.