"Детектор Плагиата" - качественное обнаружение плагиата

12
На сайте с 04.04.2011
Offline
0
2854

Доброго [localtime] уважаемое сообщество!

Я один из разработчиков проекта: Plagiarism Detector - http://www.plagiarism-detector.com

Эта программа изначально позиционируется для студентов\преподавателей, но будет полезна и в области СЕО.

Что умеет особенного:

1. Основной упор делается на качество обнаружения плагиата и трейсинг источников в просмотрщике отчётов (станет понятно, когда

попробуете).

2. Интегрируется с Вордом.

3. Сделано по принципу KISS.

4. 7 типов файлов.

5. Японский\Корейский\КИтайский + иероглифические языки (определяет автоматом - статистический движок) поддерживаются.

6. Поддержка кодировок импорта *.txt файлов + поддержка Unicode в ядре со всеми вытекающими.

7. 1 уровень внешнего прокси.

8. 2 системы обнаружения цитирования (кавычки [sic! 6 видов :-)], и исключение обнаруженных ссылок внутри документа).

9. Пакетная обработка (зарегистрированная версия).

10. Интегрируется с БД (продукт PDAS), всё работает, но сайта и документации пока нет. Качать с центрального.

Заранее отвечу на некоторые вопросы:

1. Поддержки капчи нет и не будет со всеми вытекающими.

2. Работает с Гуглом и Бингом (по принципу ротации запросов).

3. Очень не хочу распространяться ЧТО и КАК именно работает - так как считаю эти кусочки "Ноу-хау" и так просто отдавать конкурентам идеи

и реализации не хочется.

Скидка в 30% купон: "searchengines.ru" без кавычек.

Поделюсь бесплатной версией если:

1. Поможете обнаружить и устранить баг\ошибку и т.п.

2. Подскажете ЧТО развивать\какой функционал.

3. Поможете в СЕО проекта.

--

С наилучшими пожеланиями

netUfo
На сайте с 09.02.2006
Offline
183
#1

А чем она лучше адвего плагиатус?

сеотехнологии.рф (http://сеотехнологии.рф/)
На сайте с 04.04.2011
Offline
0
#2
netUfo:
А чем она лучше адвего плагиатус?

1. [детальное сравнение, отличия АП и ДП я предоставлю несколькими постами ниже].

2. Если память мне не изменяет, "адвего плагиатус" это в некоторой степени клон "Plagiarism Detector-a" :), с момента старта ДП я следил за появлением аналогов\клонов (и их функционалом) и АП был одним из них. Так как DP начал разрабатываться раньше - то его шлифовка как и функционал на порядок выше и видимо повлияли на развитие АП.

У АП и ДП имеют разные векторы развития - АП изначально позиционировался для СЕО а ДП для академического сипользования. АП есть попбочным (дополнительным) продуктом в проекте Адвего.ру, а Plagiarism Detector - разрабатывался как основная самоцель.

Процитирую одного "клиента":

"На сегодняшний день, ничего подобного нет, и по качеству и по функциональности.

Примеры отчетов которые дает программа вы сможете посмотреть во вложении."

p.s. я бы этому клиенту ручки-то поотрывал 😂

--

"На вкус и цвет фломастеры разные"

K
На сайте с 31.01.2001
Offline
737
#3
CиБи:
1. Станет очевидно, если попробуете.

Боюсь, что за такой "информативный" ответ можно получить штраф.

А если беседа продолжится в таком тоне, то первый пост будет считаться спамом.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
На сайте с 04.04.2011
Offline
0
#4
Kost:
Боюсь, что за такой "информативный" ответ можно получить штраф.
А если беседа продолжится в таком тоне, то первый пост будет считаться спамом.

Прошу простить меня за неполный ответ. Мои знания о АП ограничены старой версией АП.

Я предоставлю детальное сравнение обоих продуктов в течении 24 часов, после того как протестирую последнюю версию АП.

The WishMaster
На сайте с 29.09.2005
Offline
2542
#5

Опять путают копирование текста и плагиат?:)

Кому старенького креативного копирайтера? Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
[Удален]
#6

Последнее время много программ делают, но я доверяю одной - это адвенго.

На сайте с 04.04.2011
Offline
0
#7
The WishMaster:
Опять путают копирование текста и плагиат?:)

Я не уверен или я правильно понимаю что именно вы имели ввиду, и для лучшего понимания ЧТО именно ищет детектор плагиата хотел бы поделиться следующим:

"копирование текста", "копипаста", "почти дубликаты (near duplicates)", "плагиат", "рирайт (rewrite)" - это разные термины которые обладают разной шириной и могут как пересекаются так и не соотноситься прямо, но их всех можно охарактеризовать 3 свойствами:

а) "кол-во общей идентичной информации" (shared identical information volume). ОИИ - это НЕ плагиат, ОИИ становиться плагиатом если "модальность намерений автора" (см. ниже) - негативна. И это не единственный вариант - например может иместь место как случайный автоплагиат так же как и неслучайный автоплагиат, и масса других вариантов.

б) "модальность намерений автора" (intentions modality)

- нейтральная

- негативная (злой умысел, на мереное сокрытие плагиата, защита от алгоритмов обнаружения плагиата)

- позитивная (добрый умысел (качественная оригинальная статья, реферат, курсовая и т.д.), наличие ссылок на источники)

в) "степень модификации текста" (text modification degree)

- нулевая

- средняя

- очень большая

Отдельно стоят методы модификации\обфускации текста (синонимизация, рирайт человеком, шафлинг слов\знаков\предложений\фраз, вставка символов другой кодировки, замена ЧР, вставка символов белого цвета - нарушение фингерпринта и т.д. и т.п.)

Например:

1. "Хорошая оригинальная статья":

а) % ОИИ = 0%.

б) позитивная, есть источники.

в) нулевая

2. "Копипаста с википедии":

а) % ОИИ = 90% (10% на изменённые заголовки и изменение форматирования).

б) нейтральна - автор знает что он информацию брал с вики (как часто бывает оставил линки копипастом в ворде), но для него факт копипасты роли не играет.

3. "Копипаста с википедии проданная в качестве оригинальной статьи веб мастеру с частичным рерайтом":

а) %ОИИ = 90% (10% на изменённые заголовки и изменение форматирования).

б) негативная (злой умысел, намеренное сокрытие плагиата с целью эмулирования качественной работы, защита от алгоритмов обнаружения плагиата поисковой системой).

в) средняя - 50% статьи обработано синонимизатором, изменён порядок абзацев, предложений, удалены все компрометирующие ссылки.

ДП съест и обработает следующее:

"дипломная работа на 60 страниц, масса прямых цитирований и веб источников, присутствует как плагиат так и автоплагиат, введение и выводы написаны оригинально, работа обработана "антиплагиатом" с целью скрыть таковой"

Разложит по полочкам и выдаст детальный отчёт сколько чего и где. Мало того АРВ позволит точно, в режиме реального времени найти и сравнить сколько именно отдельно взятый источник "привнёс" в анализируемый текст. Карты-графы распределения ОИИ прилагаются.

А Ваш Детектор так умеет? :-)

"Детектор Плагиата" - это достаточно точный инструмент который в состоянии определить все 3 свойства для проверяемого текста.

Основная задача Детектора Плагиата - это поиск, обнаружение кол-ва Общей Идентичной Информации, формирование графа источников по отношению к исследуемому документу, определение источников, отсеивание цитированных секций, и помощь пользователю в определении Модальности автора - чтобы можно было однозначно определить ЧТО ИМЕННО из себя текст представляет. (плагиат, оригинал, автоплагиат, смесь того и того, копипаста с модификациями и т.д.).

CиБи добавил 05.04.2011 в 23:16

El_book:
Последнее время много программ делают, но я доверяю одной - это адвенго.

Аргументируйте чем вызвано такое доверие - я как разработчик буду очень признателен!

p.s. Plagiarism Detector - вложено 5+ лет интенсивной работы и исследований, текущая версия ядра - 400 билдов позади.

--

Заранее спасибо!

The WishMaster
На сайте с 29.09.2005
Offline
2542
#8

CиБи, плагиат - это умышленное присвоение авторства чужого произведения. А копипаст - это совершенно другое.

На сайте с 04.04.2011
Offline
0
#9
The WishMaster:
CиБи, плагиат - это умышленное присвоение авторства чужого произведения. А копипаст - это совершенно другое.

Эх... если б было всё так просто :-)))

The WishMaster
На сайте с 29.09.2005
Offline
2542
#10
CиБи:
Эх... если б было всё так просто :-)))

А что тут сложного? Это вопрос терминологии. Если я скопипащу текст и укажу автора, это не будет плагиат ;)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий