Сервис - Оценка работы копирайтера (оценка уникальности статьи) - Сервисы и программы для работы с SE - Практические вопросы оптимизации - Форум об интернет-маркетинге

WSGU · 2008-02-03T17:51:48.0000000Z

Предлагаю потестировать сервис оценки работы рерайтера (оценка уникальности статьи) . Сравниваем исходный текст и текст после изменения. Пожалуйста сообщите о найденных недочетах. Если сходство текстов более 50% , такие тексты можно назвать дубликатами.

WU

178

WSGU

4 февраля 2008, 08:04

#11

Kolyaj:
WSGU, яндекс не использует шинглы (про гугл ничего не скажу) хотя бы потому, что этот алгоритм требует попарного сравнения контрольных сумм. А теперь представьте, что такое попарное сравнение для миллиарда страниц. Кроме этого, алгоритм шинглов неустойчив даже по отношению к банальному изменению порядка слов. Другими словами, он максимум что может определить, так это процент копи-паста без каких-либо изменений.

Яндекс, согласно их же статьям, использует все же шинглы (супершинглы). + лексические сигнатуры. Но для оценки схожести одной статьи с другой можно обойтись только одними шинглами

69

Kolyaj

4 февраля 2008, 08:47

#12

WSGU:
Но для оценки схожести одной статьи с другой можно обойтись только одними шинглами

Нет нельзя, потому что

Kolyaj:
он максимум что может определить, так это процент копи-паста без каких-либо изменений

а рерайтеры до такой наглости редко доходят. Тем более, что

kagux:
По программе: если я удаляю часть переписанного текста, то он становится более уникальным. Но это не так.

RW

8

Roger_Wilco

4 февраля 2008, 08:55

#13

Сравнил два рерайта (из 70), созданных этой прогой (при 10 макроподстановках на 1к символов) - сходство 31%. Это считается хороший рерайт или наоборот?

Ку.

WU

178

WSGU

4 февраля 2008, 11:54

#14

Roger_Wilco:
Сравнил два рерайта (из 70), созданных этой прогой (при 10 макроподстановках на 1к символов) - сходство 31%. Это считается хороший рерайт или наоборот?

Если менее 50% то нормальный. Границей уникальности (согласно статьям от яндекса) является 50% граница. Поэтому неважно, что при удалении части текста может уменьшаться процент схожести, он все равно не становиться меньше 50%, а значит такие статьи считаются дубликатами.

Яндекс кобласит Какая должна быть посещаемость Установи "Порог CPMV" -

AV

2

AnnaVladimirovna

25 апреля 2008, 09:26

#15

WSGU, спасибо за такой нужный сервис!!!

p.s. с днем рождения!

Что делать, чтобы попасть в ответы Google Bard

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Сервис - Оценка работы копирайтера (оценка уникальности статьи)