К OZE - это простое сравнение, шинглы или что-то еще - Поисковые технологии

33

vitali_y

11 июня 2007, 10:07

#21

Тут полностью согласен с Leom - так качественно шинглы работать не будут - тут нужны другие подходы. К OZE - алгоритм вам Leom конечно не раскроет. Я то же не скажу свой.

[Удален]

11 июня 2007, 10:09

#22

vitali_y, возможно, и не будет, спору нет (тем более уже давно работают алгоритмы, которые изначально их обходят в любом виде). Только на месте тс надо было приводить нормальный пример, а не брехать.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

33

vitali_y

11 июня 2007, 10:11

#23

Miha - на достаточно большом объеме что шиглы что мой алгоритм - в принципе будут работать примерно одинаково - тут козырять нечем. То Leom что 20% что 50% тут конечно не имеет большого значения - да словами жонглировать вряд ли кому так нужно.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

253

Disell

11 июня 2007, 10:17

#24

Leom:
PlagiatInform сначала проверяет сдаваемую работу, целиком сравнивая её с уже имеющимися в базе рефератами и курсовыми.

Ну так надо такую базу создать. Или вы предлагаете их парсить (воровать) с сайтов например.

Лучшие вакансии ( http://hh.ru ) РУнета. Построй свою карьеру ( http://career.ru )

33

vitali_y

11 июня 2007, 10:19

#25

2 Leom - конкуренция так конкуренция :).

33

vitali_y

11 июня 2007, 10:25

#26

To OZE:

>>>

хорошо, семантики нет, а синтаксис?

как вы обрабатываете синонимы и толкования слова (фраз), замену сложных предлогов и вводных слов (что-то вроде: не смотря на, в виду и т.д.)?

>>>

отвечу кратко - НИКАК

Может ли сайт получить У вас упал трафик Google может обрабатывать антонимы

33

vitali_y

11 июня 2007, 10:28

#27

>>>

а как вы определяете что два куска текста одинаковые (простое сравнение, шинглы или что-то еще)?

и как быть с большими объемами информации?

>>>

я бы назвал это - ПРОСТОЕ СРАВНЕНИЕ двух чисел

33

vitali_y

11 июня 2007, 10:32

#28

ну у меня может всеже и не совсем простое... За других я не ответчик :). По скорости - это ну очень быстро порядка O(1). OZE вы получили ответы на вопросы?

152

OZE

11 июня 2007, 10:32

#29

vitali_y:
отвечу кратко - НИКАК

это у вас никак или у ТС?

если не умеете - фи, самая простая программа по замене синонимами поломает все антиплагиат

152

OZE

11 июня 2007, 10:34

#30

vitali_y:
я бы назвал это - ПРОСТОЕ СРАВНЕНИЕ двух чисел

откуда такая информация?

странно, что у вас ассоциация "строка" = "число", это справедливо для md5 алгоритма, но

1. он жутко тормозной

2. как сказал ТС, позволяет определить только точное совпадение

Переиграть и победить: как анализировать конкурентов для продвижения сайта

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Плагиат не пройдет! Или что могут современные поисковые технологии.