Плагиат не пройдет! Или что могут современные поисковые технологии.

1 234 5
vitali_y
На сайте с 23.05.2007
Offline
33
#21

Тут полностью согласен с Leom - так качественно шинглы работать не будут - тут нужны другие подходы. К OZE - алгоритм вам Leom конечно не раскроет. Я то же не скажу свой.

[Удален]
#22

vitali_y, возможно, и не будет, спору нет (тем более уже давно работают алгоритмы, которые изначально их обходят в любом виде). Только на месте тс надо было приводить нормальный пример, а не брехать.

vitali_y
На сайте с 23.05.2007
Offline
33
#23

Miha - на достаточно большом объеме что шиглы что мой алгоритм - в принципе будут работать примерно одинаково - тут козырять нечем. То Leom что 20% что 50% тут конечно не имеет большого значения - да словами жонглировать вряд ли кому так нужно.

Disell
На сайте с 05.06.2006
Offline
253
#24
Leom:
PlagiatInform сначала проверяет сдаваемую работу, целиком сравнивая её с уже имеющимися в базе рефератами и курсовыми.

Ну так надо такую базу создать. Или вы предлагаете их парсить (воровать) с сайтов например.

Лучшие вакансии ( http://hh.ru ) РУнета. Построй свою карьеру ( http://career.ru )
vitali_y
На сайте с 23.05.2007
Offline
33
#25

2 Leom - конкуренция так конкуренция :).

vitali_y
На сайте с 23.05.2007
Offline
33
#26

To OZE:

>>>

хорошо, семантики нет, а синтаксис?

как вы обрабатываете синонимы и толкования слова (фраз), замену сложных предлогов и вводных слов (что-то вроде: не смотря на, в виду и т.д.)?

>>>

отвечу кратко - НИКАК

vitali_y
На сайте с 23.05.2007
Offline
33
#27

>>>

а как вы определяете что два куска текста одинаковые (простое сравнение, шинглы или что-то еще)?

и как быть с большими объемами информации?

>>>

я бы назвал это - ПРОСТОЕ СРАВНЕНИЕ двух чисел

vitali_y
На сайте с 23.05.2007
Offline
33
#28

ну у меня может всеже и не совсем простое... За других я не ответчик :). По скорости - это ну очень быстро порядка O(1). OZE вы получили ответы на вопросы?

OZE
На сайте с 21.05.2006
Offline
152
OZE
#29
vitali_y:
отвечу кратко - НИКАК

это у вас никак или у ТС?

если не умеете - фи, самая простая программа по замене синонимами поломает все антиплагиат

OZE
На сайте с 21.05.2006
Offline
152
OZE
#30
vitali_y:
я бы назвал это - ПРОСТОЕ СРАВНЕНИЕ двух чисел

откуда такая информация?

странно, что у вас ассоциация "строка" = "число", это справедливо для md5 алгоритма, но

1. он жутко тормозной

2. как сказал ТС, позволяет определить только точное совпадение

1 234 5

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий