Etxt Антиплагиат 2.0. Проверка сайтов на уникальность.

D1
На сайте с 17.05.2009
Offline
32
#581

Создаете текстовый файл в котором пишете домен вашего сайта.

Затем указываете этот файл на вкладке Настройки - Исключения - Не проверять домены из файла

chaser
На сайте с 03.08.2005
Offline
210
#582

Спасибо.

Вот теперь понятно как. Попробую.

А то что в настройках - "исключения" - "игнорировать страницы с того же домена, что и проверяемый сайт или страница" не работает галочка - баг проги?

Видимо у меня здесь сын зарегистрирован - зашел с его компа и ответил, поэтому и получился пост от chaser.

SiteAnalyzer ( https://site-analyzer.ru/ ) - аналог Screaming Frog | Majento ( https://majento.ru/index.php?page=seo-analize ) - 70+ бесплатных сервисов SEO-аналитики
D1
На сайте с 17.05.2009
Offline
32
#583
chaser:
Спасибо.
Вот теперь понятно как. Попробую.
А то что в настройках - "исключения" - "игнорировать страницы с того же домена, что и проверяемый сайт или страница" не работает галочка - баг проги?

Я думаю - эта функция используется при проверке всего сайта или его отдельных страниц на уникальность. Пользовался только несколько раз для проверки сайта, очень удобно

E
На сайте с 30.10.2012
Offline
50
#584

Цитата:

Сообщение от Zorgy13

Здравствуйте, решил посмотреть вашу программу и сравнить со всем известной AdvegoPlagiatus. разница между вашей программой и ихней отличается на 10%

Т.е. если у вас 28% у Адвего 18% . Проверил несколько страниц, четко 10% не пойму почему такая закономерность.

artemovn:
Наверное, разные настройки (шингл, фраза). Если их сделать одинаковыми, проверьте. что получится?

Вот как раз это и наиболее занятно!) Ну, во-первых, в качестве вступления некоторые мои наблюдения по поводу Плагиатуса. Как-то он очень мало сайтов сканирует, даже при глубокой проверке и соответственно эта самая проверка происходит за считанные секунды. И потом, а выполняет ли канонизацию Плагиатус? Что-то я такой опции у него не заметила… И вообще настроек у него как-то очень мало.

Ну, так вот, сделала одинаковыми следующие настройки у Etxt Antiplagiat и Адвего Плагиатуса: Размер шингла, слов: 3, Размер фразы, слов: 10 плюс таймаут в обеих случаях увеличен до 60 сек. И что же я увидела? Был у меня 1 отрерайтенный текст, уникальность которого Etxt Antiplagiat при 2 проверках показал стабильно 97-98%. При этом были найдены совпадения по всего 2-3 фразам: "с 4 ноября 2010 г.», «кино о Великой Отечественной войне» и второй раз вдруг совпало «Всё остальное, на мой взгляд, лишнее». Но вот Плагиатус при глубокой проверке с ТЕМИ ЖЕ САМЫМИ вышеуказанными настройками нашёл море совпадений. Для примера приведу лишь некоторые из них: «оно в первую очередь заинтересовано», «Кто-кто, а», «победу. После чего», «действующие лица — советские» и т.д. Естественно итоговая уникальность резко понизилась!

Вот отчет:

[14:30:36] Быстрый поиск. Проверка исходного документа

[14:30:36] Анализ исходного документа

[14:30:36] Подготовка запросов поиска

[14:30:38] Поисковая система [Яndex] заблокирована!

[14:30:51] Поисковая система [Яndex] доступна

[14:32:47] Найдено: 10 страниц. Проверено без ошибок: 10

[14:32:47] Не найдено похожих документов

[14:32:47] Уникальность текста 100%

Очень высокая уникальность текста

[14:32:57] Глубокий поиск. Проверка исходного документа

[14:32:57] Анализ исходного документа

[14:32:57] Подготовка запросов поиска

[14:33:01] Найдено 13% совпадений по адресу: http://stalinism.narod.ru/kino/brestskaya-krepost.htm

[14:33:02] Найдено 14% совпадений по адресу: http://www.bosonogoe.ru/blog/film/1978.html

[14:33:02] Найдено 13% совпадений по адресу: http://newzz.in.ua/culture/1148853534-brestskaya-krepost-film-recenziya-goblina.html

[14:33:02] Найдено 13% совпадений по адресу: http://tbrus.ucoz.ru/publ/brestskaja_krepost/1-1-0-257

[14:33:03] Найдено 13% совпадений по адресу: http://metrolog.org.ua/brest

[14:33:03] Найдено 13% совпадений по адресу: http://otvet.mail.ru/question/48727257

[14:33:04] Найдено 13% совпадений по адресу: http://work-engels.ru/archives/2871

[14:33:04] Найдено 14% совпадений по адресу: http://kino.otzyv.ru/film.php?id=2798

[14:33:05] Найдено 13% совпадений по адресу: http://yablor.ru/blogs/brestskaya-krepost-film-otziv-goblina/887463

[14:33:23] Ошибка (Не удалось соединиться с сервером): http://chestimeem.ru/%D1%84%D0%BE%D1%80%D1%83%D0%BC/%D0%B1%D1%80%D0%B5%D1%81%D1%82%D1%81%D0%BA%D0%B0%D1%8F-%D0%BA%D1%80%D0%B5%D0%BF%D0%BE%D1%81%D1%82%D1%8C-%D1%84%D0%B8%D0%BB%D1%8C%D0%BC

[14:33:23] Найдено: 36 страниц. Проверено без ошибок: 34

[14:33:23] Найдено 14% совпадений всего

[14:33:23] Уникальность текста 86%

Высокая уникальность текста

Я в полном замешательстве! Кому теперь верить?! Или же я что-то делаю не так? Учитывая что «Поисковиками считается приемлемой уникальность не ниже 96-98%.» (цитата из статьи на www.webeffector.ru). Я понимаю что мой рерайт мягко говоря не очень качественный но ведь размер шингла и тут и там ОДИН И ТОТ ЖЕ!

fdsm
На сайте с 19.01.2010
Offline
53
#585

Размер шингла 3 слова - это мазохизм.

E
На сайте с 30.10.2012
Offline
50
#586
fdsm:
Размер шингла 3 слова - это мазохизм.

Что Вы имели под этим ввиду?))) Ведь в Etxt Антиплагиат размер шингла ПО УМОЛЧАНИЮ равен 3! Или тогда получается что и сама программа - мазохизм?!

L
На сайте с 10.06.2010
Offline
85
#587
Estelle:
но ведь размер шингла и тут и там ОДИН И ТОТ ЖЕ!

Скорее всего дело в том, что тут размер шингла все же нельзя сравнивать напрямую. В etxt антиплагиат размер шингла равный 3 (в отличие от 4, 5 итд) обрабатывается особым образом - он не считает совпадением найденный одиночный трехсловный шингл (то есть если на расстоянии одного-двух слов от него рядом нет другого совпавшего трехсловного шингла). То есть на самом деле это получается некий промежуточный вариант между размером шинглов в 3 и 4.

разработчик программы Etxt Антиплагиат
E
На сайте с 30.10.2012
Offline
50
#588
lesss:
Скорее всего дело в том, что тут размер шингла все же нельзя сравнивать напрямую. В etxt антиплагиат размер шингла равный 3 (в отличие от 4, 5 итд) обрабатывается особым образом - он не считает совпадением найденный одиночный трехсловный шингл (то есть если на расстоянии одного-двух слов от него рядом нет другого совпавшего трехсловного шингла). То есть на самом деле это получается некий промежуточный вариант между размером шинглов в 3 и 4.

Ой, как сложно-то всё! Но я думаю так: какова КОНЕЧНАЯ цель рерайта? А цель эта как сами понимаете сделать текст уникальным именно для поисковых систем. Если тот же Гугл или Яндекс определит уникальность в 80% то грош цена всем этим Антиплагиатам с их 98%! Извините, но я только учусь, как Вы и сами догадались наверное... В связи с чем интересно узнать: а какой размер шингла и прочее используют ведущие поисковики для определения уникальности?

Моё мнение таково: рерайт - дело серъёзное и никаких "промежуточных вариантов" здесь быть не может! Надо приходить к какому-то стандарту что-ли, уж извините...

E
На сайте с 30.10.2012
Offline
50
#589

Да, и в самом деле как-то так и получается! Увеличила в Адвего Плагиатусе размер шингла до 4 и уникальность того же текста поднялась аж до 100%! Дополнительно проверила другой текст – та же самая картина! И чтобы ещё более уточнить ситуацию последовала цитате одного гражданина из команды Адвего: “Лично я проверяю покупаемые мной тексты 1 раз на глубокой проверке с настройками "шингл=4, фраза=4". Так же наблюдаются 97-100%!

Вот ещё в Плагиатусе есть такая опция как "Ограничение на размер" (по умолчанию 512 Кб). Что она означает наверное лучше у автора этой программы спросить. Но всё же в Антиплагиате это аналогично чему?

S9
На сайте с 05.12.2012
Offline
0
#590
Denis11036:
Создаете текстовый файл в котором пишете домен вашего сайта.
Затем указываете этот файл на вкладке Настройки - Исключения - Не проверять домены из файла

Сделал как Вы посоветовали (хотя не понятно зачем тогда на главной странице, в левом верхнем углу окно "адрес" и еще галочка для него в опциях, которая совсем не работает).

Несколько дней действительно исключались из анализа страницы домена указанного в этом файле, а сегодня прога опять стала их анализировать.

Так что прога хорошая, но не доработана.

Буду пробывать другую.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий