Сервис - Оценка работы копирайтера (оценка уникальности статьи)

12
WU
На сайте с 07.10.2007
Offline
173
#11
Kolyaj:
WSGU, яндекс не использует шинглы (про гугл ничего не скажу) хотя бы потому, что этот алгоритм требует попарного сравнения контрольных сумм. А теперь представьте, что такое попарное сравнение для миллиарда страниц. Кроме этого, алгоритм шинглов неустойчив даже по отношению к банальному изменению порядка слов. Другими словами, он максимум что может определить, так это процент копи-паста без каких-либо изменений.

Яндекс, согласно их же статьям, использует все же шинглы (супершинглы). + лексические сигнатуры. Но для оценки схожести одной статьи с другой можно обойтись только одними шинглами

Kolyaj
На сайте с 28.03.2006
Offline
69
#12
WSGU:
Но для оценки схожести одной статьи с другой можно обойтись только одними шинглами

Нет нельзя, потому что

Kolyaj:
он максимум что может определить, так это процент копи-паста без каких-либо изменений

а рерайтеры до такой наглости редко доходят. Тем более, что

kagux:
По программе: если я удаляю часть переписанного текста, то он становится более уникальным. Но это не так.
RW
На сайте с 21.11.2007
Offline
8
#13

Сравнил два рерайта (из 70), созданных этой прогой (при 10 макроподстановках на 1к символов) - сходство 31%. Это считается хороший рерайт или наоборот?

Ку.
WU
На сайте с 07.10.2007
Offline
173
#14
Roger_Wilco:
Сравнил два рерайта (из 70), созданных этой прогой (при 10 макроподстановках на 1к символов) - сходство 31%. Это считается хороший рерайт или наоборот?

Если менее 50% то нормальный. Границей уникальности (согласно статьям от яндекса) является 50% граница. Поэтому неважно, что при удалении части текста может уменьшаться процент схожести, он все равно не становиться меньше 50%, а значит такие статьи считаются дубликатами.

AV
На сайте с 28.01.2008
Offline
2
#15

WSGU, спасибо за такой нужный сервис!!!

p.s. с днем рождения!

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий