А если у меня в настройках стоит длина шингла 3, а в отчёте хочу видеть цепочки из не менее 6 слов?
Не, попробую ещё раз описать. Допустим, в настройках я выставляю специальный параметр в 6 слов. И в конце получаю отчёт:
[4:04:18] Уникальность текста равна 77% Подозрение на плагиат во фразах: «Граф Лев Николаевич Толстой родился 9 сентября 1828 года», «Последние годы жизни Лев Николаевич проводит» и «нежная утонченная барыня будет пожирать трупы этих животных с полной уверенностью в своей правоте».
То есть мне не нужно вручную анализировать подсвеченные фразы из отчёта, выбирать из них фразы нужной длины и копировать их по отдельности.
Очень актуально при пакетном анализе по 20-30 текстов зараз =)
Ребятки, спасибо за лучший антиплагиатор!
Сделайте, пожалуйста, такую опцию, чтобы в отчёте о плагиате вместе с:
«Найдено 15% совпадений (52 миллисек.) по адресу: http://www.××××××××.ru/ (1422 миллисек.)»
так же писались те фразы, которые были найдены по этому адресу. Чтобы можно было сразу скидывать отчёт рерайтерам вместе с фразами, которые необходимо переделать. А то вручную устаю копировать.
И было бы не плохо иметь опцию отключения отображения «(52 миллисек.)» и «(1422 миллисек.)».
Хорошо, настроил антиплагиант в обход proxifier — та же хрень.
Значит отключение загрузки картинок и JS в IE и увеличение производительности антиплагиата просто совпадение.
Так почему тогда через браузер эти страницы грузятся моментально? А антиплагиат их пачками маркирует как незагруженные? То есть это нормально что 90% страниц антиплагиант не может загрузить или нет?
Что-то последние пару дней программа (версия 2.0.3.0) хреново работает. Для 99% скачиваемых страниц пишет «Не удалось загрузить страницу из запроса №36-3 (14623 миллисек.)», хотя через браузер они открываются за пару секунд. Хотя на прошлой неделе вроде всё ок было...
Возможно дело в том, что проверяю с ноута, инет у которого через прокси (домашняя сеть) на связке HandyCache+Proxifier. Скорость соединения 1Мбит (вх)/8Мбит (исх)/ Но другой софт отлично работает, даже WebMoney. По идее при такой связке Etxt Антиплагиат должен работать в режиме «Прямое подключение к Интернету», но по факту не работает без принудительного указания адреса моего прокси.
Расскажите как вообще устроена работа с прокси у программы и как лучше всё это дело настроить. Пробовал и в Proxifier включать/выключать различные фильтры, и включать/выключать прокси в настройках ИЕ. Всё равно очень большой процент «Не удалось загрузить страницу из запроса». Таймаут закачки 30 сек, максимальное кол-во одновременно закачиваемых страниц — 1-2. При этом через браузер такие страницы грузятся моментально.
Пробовал запускать на компе с прямым подключением, тоже самое, очень много ошибок....
Прошло 20 минут....
Пошаманил с настройками, вроде как большая часть страниц прогружатеся, но проверка статьи 2к символов занимает минут 6-8. Хотя в логах пишется что время ответа страниц не более 3000 мс. В настройках: таймаут закачки 20 сек, максимальное кол-во одновременно закачиваемых страниц — 5-10.
Я так понимаю Etxt Антиплагиат грузит странички через движок IE и дожидается загрузки всех картинок и скриптов? То есть какая-нибудь хреновая картинка может не дать обработать страницу? По каким параметрам страница считается не загруженной? По идее нужно указывать конкретную причину, ибо 99% не загруженных страниц отлично загружаются в браузере.
Посмотрел логи HandyCache. Все страницы отдают статус 200, причём моментально. Так же в логах загруженных страниц в разы больше, чем показывается в журнале.
Только начал лить траф - сайты ушли в даун =)
Плохой знак...
Я занимался автоматизацией работы с ISP панелью, но об этом не писал. Но если попросите - напишу =)
а что мешает одновременно со своими дорами чекать соседей по топу? 🙄
Заказал прогон по каталогам, ТС весьма вежлив и компетентен. Жду результатов....
Яндекс мою схему "дор -> редирект на site.ru с счетчиком -> редирект на партнерку" спалил в течении месяца и после банил такие доры очень быстро. Так что нужно быть готовым в любой момент оперативно модифицировать такую схему до неузнаваемости.