mihas

Рейтинг
236
Регистрация
28.02.2006
MasterKlass:
Когда указываешь страницу с уникальным контеном "www.site.ru", то пишет что найден дубль на странице "http://www.site.ru/", хотя это одно и то же =) надо будет как-то исправить, чтоли..

Странно, так не должно быть, мы это учитывали. Проверим.

юни, честно говоря, я такие объемы никогда не пробовал, у меня даже столько текста нет :) Я проверял статьи, объемом до 9000 символов, тормозов и зависаний не наблюдалось. Но надо будет поэкспериментировать.

vtomas:
Законный вопрос через сколько времени можно пользоваться поиском повторно?

Да хоть каждую секунду. В том, что программа один раз нашла дубликат а второй нет ничего нет удивительного. Текст разбивается на куски и во-первых каждый раз эти куски разные а во-вторых проверяются на плагиат тоже всегда разные куски. Вот собственно и причина.

kboris:
Наверное, глупый вопрос, но откуда эта программа берет базу текстов для сравнения?

Яндекс.

newseditor:
ТС, англоязычные статьи можно проверять на уникальность?

Можно, но на уникальность в Яндексе.

Львович, ну тогда нужно уже целый алгоритм писать а может и словарь добавлять, что утяжелит программу. А оно надо? Ведь предназначение у программы совсем другое.

Ну, тут уж надо вручную тогда смотреть. Определить, нужные ли символы в тексте или нет программа не сможет.

Как и обещал, на странице http://textbroker.ru/main/dcfinder.html доступна новая версия DCFinder v1.02. Она сообщит вам перед проверкой о наличии в тексте латинских символов.

У меня тоже самое. Уведомления о сообщениях в личку тоже не приходят. Ящик на @gmx.de

В течение нескольких дней будет готова новая версия с проверкой текстов на предмет подмены русских символов английскими.

Я только не понимаю, причем здесь DCFinder. Что вы ему дали, то он и ищет. Дали текст, в котором половина англиских букв и он ничего не нашел, что вполне естесственно.

Ок, ок. Записал себе, сделаем. Хотя вы меня не убедили в необходимости этой функции.

Всего: 1867