Holy Diver

Рейтинг
20
Регистрация
13.04.2009
lesss:
А насчет анализа фраз нужной длины - если стоит настройка шингла в 6 слов, то в отчете всегда будут выделяться только фразы с совпадениями не меньше в 6 слов.

А если у меня в настройках стоит длина шингла 3, а в отчёте хочу видеть цепочки из не менее 6 слов?

lesss:
Это загромоздит отчет. А совпавшие фразы и так подсвечены в итоговом html-отчете

Не, попробую ещё раз описать. Допустим, в настройках я выставляю специальный параметр в 6 слов. И в конце получаю отчёт:

[4:04:18] Уникальность текста равна 77%

Подозрение на плагиат во фразах: «Граф Лев Николаевич Толстой родился 9 сентября 1828 года», «Последние годы жизни Лев Николаевич проводит» и «нежная утонченная барыня будет пожирать трупы этих животных с полной уверенностью в своей правоте».

То есть мне не нужно вручную анализировать подсвеченные фразы из отчёта, выбирать из них фразы нужной длины и копировать их по отдельности.

Очень актуально при пакетном анализе по 20-30 текстов зараз =)

Ребятки, спасибо за лучший антиплагиатор!

Сделайте, пожалуйста, такую опцию, чтобы в отчёте о плагиате вместе с:

«Найдено 15% совпадений (52 миллисек.) по адресу: http://www.××××××××.ru/ (1422 миллисек.)»

так же писались те фразы, которые были найдены по этому адресу. Чтобы можно было сразу скидывать отчёт рерайтерам вместе с фразами, которые необходимо переделать. А то вручную устаю копировать.

И было бы не плохо иметь опцию отключения отображения «(52 миллисек.)» и «(1422 миллисек.)».

Хорошо, настроил антиплагиант в обход proxifier — та же хрень.

Значит отключение загрузки картинок и JS в IE и увеличение производительности антиплагиата просто совпадение.

Так почему тогда через браузер эти страницы грузятся моментально? А антиплагиат их пачками маркирует как незагруженные? То есть это нормально что 90% страниц антиплагиант не может загрузить или нет?

lesss:
Прокси можно указать в настройках программы (Настройки / Сеть)

Программа не качает страницы через IE и не грузит картинки или скрипты.

Сообщения типа "Не удалось загрузить страницу из запроса..." выдаются как раз в случае, когда
причины незагрузки не ясны. Ответ со статусом 200 означает получение только заголовка, само тело страницы было не загружено (или не до конца загружено).

Что-то последние пару дней программа (версия 2.0.3.0) хреново работает. Для 99% скачиваемых страниц пишет «Не удалось загрузить страницу из запроса №36-3 (14623 миллисек.)», хотя через браузер они открываются за пару секунд. Хотя на прошлой неделе вроде всё ок было...

Возможно дело в том, что проверяю с ноута, инет у которого через прокси (домашняя сеть) на связке HandyCache+Proxifier. Скорость соединения 1Мбит (вх)/8Мбит (исх)/ Но другой софт отлично работает, даже WebMoney. По идее при такой связке Etxt Антиплагиат должен работать в режиме «Прямое подключение к Интернету», но по факту не работает без принудительного указания адреса моего прокси.

Расскажите как вообще устроена работа с прокси у программы и как лучше всё это дело настроить. Пробовал и в Proxifier включать/выключать различные фильтры, и включать/выключать прокси в настройках ИЕ. Всё равно очень большой процент «Не удалось загрузить страницу из запроса». Таймаут закачки 30 сек, максимальное кол-во одновременно закачиваемых страниц — 1-2. При этом через браузер такие страницы грузятся моментально.

Пробовал запускать на компе с прямым подключением, тоже самое, очень много ошибок....

Прошло 20 минут....

Пошаманил с настройками, вроде как большая часть страниц прогружатеся, но проверка статьи 2к символов занимает минут 6-8. Хотя в логах пишется что время ответа страниц не более 3000 мс. В настройках: таймаут закачки 20 сек, максимальное кол-во одновременно закачиваемых страниц — 5-10.

Я так понимаю Etxt Антиплагиат грузит странички через движок IE и дожидается загрузки всех картинок и скриптов? То есть какая-нибудь хреновая картинка может не дать обработать страницу? По каким параметрам страница считается не загруженной? По идее нужно указывать конкретную причину, ибо 99% не загруженных страниц отлично загружаются в браузере.

Посмотрел логи HandyCache. Все страницы отдают статус 200, причём моментально. Так же в логах загруженных страниц в разы больше, чем показывается в журнале.

png etxt1.png

Только начал лить траф - сайты ушли в даун =)

Плохой знак...

Я занимался автоматизацией работы с ISP панелью, но об этом не писал. Но если попросите - напишу =)

а что мешает одновременно со своими дорами чекать соседей по топу? 🙄

Заказал прогон по каталогам, ТС весьма вежлив и компетентен. Жду результатов....

Яндекс мою схему "дор -> редирект на site.ru с счетчиком -> редирект на партнерку" спалил в течении месяца и после банил такие доры очень быстро. Так что нужно быть готовым в любой момент оперативно модифицировать такую схему до неузнаваемости.

Всего: 73