Etxt Антиплагиат 2.0. Проверка сайтов на уникальность.

E
На сайте с 30.10.2012
Offline
50
#801
lesss:

2. Метод обнаружения рерайта основан на обнаружении локальной близости одних и тех же слов в проверяемом тексте и текстах из интернета. "Под одними и теми же словами" следует понимать слова с одной и той же основой, то есть, например, слово "чемодан" и "чемоданами" будут считаться одинаковыми.
3. "Локальная проверка" - это проверка на уникальность текста не в интернете, а среди документов, которые находятся у вас в компьютере. Есть требование - они должны находиться в проиндексированной системой папке.

2. Извините меня такую непонятливую, но рерайт проверяется без учета шингла в N-ое кол-во слов, так? Просто любое совпадение слов, верно? Хорошо, пусть с одинаковой основой, но по моим наблюдениям предлоги, а также знаки препинания и прочие символы тоже учитываются? В смысле, канонизация здесь тоже не применяется?

Кстати, а почему проверки на уник и рерайт запускаются только по отдельности? Я сейчас не хотела бы приводить в пример аналогичные программы, но кое у кого сразу вместе они и происходят...

3. все равно не поняла:( То есть 2 локальных документа можно сравнить между собой? И для этого обязательно должна работать служба индексирования Windows?

L
На сайте с 10.06.2010
Offline
85
#802

Estelle, да, рерайт проверяется без учета шингла в N-ое кол-во слов. Предлоги и знаки препинания не учитываются, канонизация здесь также применяется как и в методе шинглов.

Насчет локальной проверки на примере - у вас есть 100 текстов в папке, а есть еще 1 документ, который вы хотите проверить на совпадения по отношению к этим 100. Вот в чем смысл. Служба индексирования Windows обязательно должна быть включена, без нее локальная проверка не будет работать.

разработчик программы Etxt Антиплагиат
E
На сайте с 30.10.2012
Offline
50
#803
lesss:
...Метод обнаружения рерайта основан на обнаружении локальной близости одних и тех же слов...

Еще раз извините, но вновь не все понятно😕. Насколько близко они могут соседствовать друг с другом? Может быть, что текст, к примеру, на 10к збп, а одно слово найдено в его начале, а другое в самом конце? Хотя по моему опыту (единичному пока что) программа нашла наибольший процент совпадений по рерайту аккурат в источнике и там эти схожие фразы находятся в разных, значительно отдаленных по времени постах на форуме (это форум forum.searchengines.ru, между прочим).

---------- Добавлено 25.10.2013 в 22:12 ----------

lesss:
Предлоги и знаки препинания не учитываются...

А почему тогда проверка на рерайт у меня обнаружила (выделила цветом), например такое – "? Издержки профессии" (здесь вопросительным знаком завершается предыдущее предложение).

---------- Добавлено 25.10.2013 в 22:14 ----------

lesss:
Насчет локальной проверки на примере - у вас есть 100 текстов в папке, а есть еще 1 документ, который вы хотите проверить на совпадения по отношению к этим 100.

И здесь не все до конца понятно😕. Документы с какими расширениями поддерживаются? Doc, txt или еще какие? И можно ли txt сравнить с doc, например?

ЗЫ. Напишите, пожалуйста, хотя бы тоооонюююсенький мануалчик, а то ведь по крохам да по всему интернету приходится выискивать информацию, и к тому же часто из некомпетентных источников.

B
На сайте с 15.01.2013
Offline
6
#804

А можно добавить добавить Пакетную, уникальную проверку?

И пакетную уникальную для изображений?

L
На сайте с 10.06.2010
Offline
85
#805
Estelle:
Еще раз извините, но вновь не все понятно😕. Насколько близко они могут соседствовать друг с другом?

Чем ближе, тем лучше.

---------- Добавлено 28.10.2013 в 20:44 ----------

Estelle:

А почему тогда проверка на рерайт у меня обнаружила (выделила цветом), например такое – "? Издержки профессии"

Выделить-то выделилось, но это при подсчете не учитывается. В методе шинглов то же самое - так же выделяются запятые и прочее, но это не учитывается при итоговом подсчете уникальности.

---------- Добавлено 28.10.2013 в 20:48 ----------

Estelle:
Документы с какими расширениями поддерживаются? Doc, txt или еще какие? И можно ли txt сравнить с doc, например?

Поддерживаются txt, doc(docx), pdf. Да, можно.

---------- Добавлено 28.10.2013 в 20:50 ----------

bestdeal:
А можно добавить добавить Пакетную, уникальную проверку?

И пакетную уникальную для изображений?

Не понял насчет пакетной уникальной проверки. Есть пакетная проверка - в Настройки / Операции / пакетная проверка...

Насчет пакетной проверки изображений - это не планируется.

B
На сайте с 15.01.2013
Offline
6
#806
lesss:

Не понял насчет пакетной уникальной проверки. Есть пакетная проверка - в Настройки / Операции / пакетная проверка...
Насчет пакетной проверки изображений - это не планируется.

Есть папка с новыми файлами, и есть папка со старыми), ок?)

L
На сайте с 10.06.2010
Offline
85
#807

bestdeal, все равно не понял, но что-то наверно специфическое, что вряд ли будет реализовано.

E
На сайте с 30.10.2012
Offline
50
#808
lesss:
Чем ближе, тем лучше.

Ох! Ну извините меня, тАрмАзную блАндинку! Все равно не понимаю! Кому лучше? Мне? или для уникальности лучше? Хотя, как я смотрю, все работает четко и не так уж страшен этот черт как его малюют.

Кстати, почему фраза "Уникальность текста N%" в конце отчета о проверке оформлена в виде ссылки на какой-то непонятный и недоступный сайт http://www.sel_res.ru/???history=0&f=1. Это что, наши уникальные (и не очень:)) тексты в какой-то архив помещаются?

Вот еще скромный вопросик: нельзя ли сделать проверку тошноты текста, как на неком популярном онлайн сервисе? Как я понимаю, для этого и к инету ведь даже подключаться не надо? А то выходит так, что текст может оригинальный написан, а с ключами непреднамеренно переборщила.

L
На сайте с 10.06.2010
Offline
85
#809
Estelle:
Кому лучше?

Имелось ввиду, что совпадения находятся, если поблизости находятся те же слова, что и в проверяемом документе. В таком методе, в отличие от метода шинглов, простая перестановка слов или изменение окончаний не повысят уникальность.

---------- Добавлено 05.11.2013 в 23:18 ----------

Estelle:
почему фраза "Уникальность текста N%" в конце отчета о проверке оформлена в виде ссылки

Просто баг, это служебная ссылка, которая удаляется перед созданием отчета.

---------- Добавлено 05.11.2013 в 23:20 ----------

Estelle:
нельзя ли сделать проверку тошноты текста, как на неком популярном онлайн сервисе?

Для этого уже вроде есть соответствующие программы, не требующие выхода в интернет.

Conan Varvar
На сайте с 06.11.2011
Offline
249
#810

Классная программка - в отличии от аналогичного продукта от Адвего выводит страницы сайтов, где есть копии!

1. Нужен качественный трафик? Лучшие тизерные сети! (http://tizernie-seti.ru/тизерные_сети/) 2. Лучший хостинг сайтов!! (http://tizernie-seti.ru/хостинг_сайтов/) 3. Лей на Виагру на свой шоп!! (https://goo.gl/f17SLS) Инвайт dSMP8aVF7jAkmw8F

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий