lesss

Рейтинг
85
Регистрация
10.06.2010
yanavit:


Вопрос: как сделать так чтобы в логах программы отображались только дубли страниц внутри этого же сайта (lifexist.ru). Какая страница дублирует какую и на сколько процентов.

Этого в программе не предусмотрено. Фильтр в "Проверка сайта" относится к страницам проверяемого сайта, а не к тем, с которыми происходит проверка на похожесть. В вашем случае разве что можно в настройках программы снять галку которая стоит по умолчанию - "Настройки / Исключения / Игнорировать страницы с того же домена, что и проверяемый сайт", а также выставить порог уникальности в 0%, чтобы проверка не заканчивалась досрочно ("Настройки / Общие / Порог уникальности"). - Но все равно это не совсем то что вы хотите. В вашем случае нужен просто другой алгоритм, и поисковые системы совсем не нужны.

yanavit:
Программа - класс! Спасибо!
Сделайте, пожалуйста, функцию проверки уникальности ТОЛЬКО внутри сайта.

По идее и должно проверяться только внутри сайта, в пределах домена второго уровня. На каком сайте у вас тянутся посторонние ссылки, и что это за ссылки ?

videoinspector:
хотел проверить статьи с сайта где требуется аутентификация,
ничего не получается😒

В программе нельзя проверить сайты, которые требуют аутентификацию

algan:
Подскажите пожалуйста, при запуске программы выдаёт "Произошла ошибка при инициализации программы: Значение не попадает в ожидаемый диапазон.", она дальше запускается, но проверять не хочет?

Пришлите в личку файл C:\Documents and Settings\<Ваша учетная запись>\Local Settings\Application Data\Inet-trade\EtxtAntiplagiat.exe_<произвольные буквы>\2.0.17.0\user.config (если у вас windows xp)

(некоторые папки являются скрытыми, так что нужно для начала в свойствах проводника windows включить отображение скрытых файлов (Сервис/Своиства папки.../Вид/Скрытые файлы и папки/Показывать скрытые файлы и папки))

Попробуйте сделать так: /ru/forum/comment/8664441

светлена:
У меня эта прграмма не запускается. Пишет что-то там не загружается

Единственно, что может загружаться при установке - это .NET Framework 2.0 при его отсутствии в операционной системе. Попробуйте проверить доступность следующего адреса - http://www.microsoft.com/downloads/en/details.aspx?familyid=5B2C0358-915B-4EB5-9B1D-10E506DA9D0F&displaylang=en#QuickInfoContainer

Если он доступен через браузер, а установить программу все равно не получается - скачайте вручную .NET Framework 2.0 по указанному адресу (там 3 ссылки на скачку, в зависимости от вашей платформы, скорей всего это NetFx20SP2_x86.exe если у вас 32-битная windows xp) и установите его.

cjseriy:
поставил 25 одновременных загрузок, использую antigate, стало много выходить ошибок Невозможно разрешить удаленное имя.
Нужен список прокси, я верно понимаю?
Где его посоветуете купить и какой тип прокси лучше будет?

Ошибки вида "Невозможно разрешить удаленное имя" - совершенно нормальны, если в браузере также данные страницы недоступны. Главное чтобы не стало выходить много ошибок по превышению таймаута и ошибок вида "Не удалось загрузить страницу".

Если используете antigate, то можно обойтись и без прокси. Прокси - просто другой способ борьбы с блокировкой поисковых систем (с ними проверка может занять времени раза в три больше). При использовании antigate можно отключить поисковую системы Mail.ru, чтобы денег меньше уходило, так как она самая прожорливая в этом плане.

Однажды сами покупали прокси, но особой разницы от тех списков, что и так доступны бесплатно не было замечено. Насчет типа прокси - более важно насколько прокси доступен и незаезжен, чем его тип.

cjseriy:
Буду Вам признателен, если сообщите, когда будет выложена новая версия программы, где это исправлено.
Также отмечу, что бывает выходит ошибка system.outofmemoryexception при глубокой проверке большого количества файлов и программа останавливается. Если бы проверка шла по алфавиту, то продолжить было бы не проблема.

И еще вопрос: как ускорить процесс глубокой проверки, от чего зависит скорость? 40 файлов проверяются по 10 часов. Настройки: Размер выборки:10, Число выборки:30, мин интервал:4, Таймаут: 100, Макс. кол. одно-но скач. стртаниц:15. Соединение интернет: Входящая скорость 3 Mбит/сек
Исходящая скорость 500 Kбит/сек
Если сменить тариф на 5 Mбит/сек будет ли удвоение скорости проверки?

Новая версия будет выложена скоро. Насчет ошибки с памятью - поставьте галку в настройках программы "Настройки / Скачка / Экономия памяти", а также установите параметр "Настройки / Отчет / История" в 1.

С такой скоростью таймаута достаточно и 40-50. Поставьте также галку "Настройки / Скачка / Использовать альтернативную схему скачки". Смена на более быстрый тариф должна сказаться положительно на скорости работы (правда вряд ли вдвое), но следует учитывать, что скорость работы программы также завязана на операцию сравнения текстов (скорость сравнения находится в прямой зависимости от мощности процессора и кол-ва ядер). Также можете попробовать с такой скоростью интернета увеличить параметр "Макс. кол. одно-но скач. страниц" с 15 до 30 (если это не приводит к увеличению ошибок и таймаутов).

cjseriy:
При пакетной проверке бывает выходит ошибка
Произошла фатальная ошибка: Отсутствует текст, для которого требуется определить уникальность

После нее продолжить проверку не возможно, да и удалить файлы которые были уже проверены, чтобы потом проверить лишь оставшиеся нельзя. Приходится просто удалять файл вызвавший ошибку и запускать на проверку заново с нуля. Не удобно.

Хотя бы проверяла файлы при пакетной обработки по алфавиту по порядку, а так вообще проверяет вразнобойку.

Предполагалось, что они будут сортироваться по алфавитному порядку. Это будет исправлено.

palarmaz:
Программа хороша, но есть один минус, довольно таки неприятный. Редактировать текст можно, но редактируется он коряво. Стоит только стереть одну букву в слове, и заменить ее на нужную - стирается следующая буква, следующая и т.д. Очень не приятно.

Может дело все же в режиме вставки ? (При нажатии клавиши Ins действует обычное правило для текстовых редакторов - переключение режима вставки в варианты "Вставка" и "Замещение" ). У вас похоже на то, что режим вставки был (возможно случайно нажали на Ins) установлен в "Замещение".

lesss добавил 12.04.2011 в 12:47

Sirius34:
мне кажется, что правильно было бы исключить из проверки на уникальность цитаты и названия официальных нормативных актов
а то получается бред - если в работе присутствуют цитаты из законов и Конституции, то они считаются плагиатом!!! даже название закона выделяется и тоже считается плагиатом! просто задумайтесь - на каком количестве сайтов в интернете написано, например, название закона "О государственной гражданской службе"? а цитаты из него?

Эта фраза может быть как цитатой, так и частью текста, который был заимствован из чьей-то статьи (то есть факт плагиата).

doggydog:
Если страница статьи с введёным текстом ещё не проиндексирована поисковиками, программа покажет, что текст уник?

Если ни одна из задействованных поисковых систем не проиндексировала страницу, то программа не найдет эту страницу.

Всего: 432