Опрос. Способ проверки текста на уникальность. Кто чем пользуется.

Avatar 0
[Удален]
#421

Зачастую, при проверке нашим сервисом, уникальность текстов оказывается ниже, чем при проверке другими программами. Это связано с тем, что в нашем алгоритме не используется метод шинглов. Поэтому сервис находит не только тексты, в которых есть совпадения определенного количества слов, но и те тексты, где слова, фразы и предложения переставлены местами, где изменены грамматические формы слов и т.д.

Avatar 0
[Удален]
#422

gtauter, у нашего сервиса не шингловый алгоритм проверки, соответственно, он может находить те тексты, в которых был изменен порядок слов, фраз и предложений, и в которых были изменены грамматические формы слова. Некачественный рерайт или копирайт, который возможно будет иметь 95% уникальности, полученный путем проверки с помощью шинглов, невысоко котируется ПС при ранжировании сайтов.

Что касается вопроса о минимальном проценте уникальности, то для текстов со строительной, юридической и др. подобными тематиками (где много устойчивых фраз и выражений, которые никак нельзя перефразировать), нормальна уникальность от 80% и выше. В остальных случаях нормальна уникальность 95-100%

#423

Когда-то пользовался http://istio.com/rus/text/analyz/

Потом перешел на Адвего.

И3 161
#424

В последнее время больше пользуюсь етхт, чем Адвего, более качественная проверка уникальности.

Avatar 6
#425

Только вот на Etxt всего 3 проверки в сутки бесплатные. И даже платные вечером, часиков так с 5 не проходят - дикие очереди.

Пишу статьи, а не генерирую лабуду
E 50
#426
TEXT_RU:
gtauter, у нашего сервиса не шингловый алгоритм проверки, соответственно, он может находить те тексты, в которых был изменен порядок слов, фраз и предложений, и в которых были изменены грамматические формы слова. Некачественный рерайт или копирайт, который возможно будет иметь 95% уникальности, полученный путем проверки с помощью шинглов, невысоко котируется ПС при ранжировании сайтов.

Извините, но я что-то не поняла: есть еще какой-то другой, отличный от шинглового, алгоритм проверки? Правда, первый раз слышу! Да и как мне известно, большинство тружеников бирж контента именно таким образом обрабатывают тексты, как вы тут описали! И что теперь, ПС низко оценивают те сайты, на которых их контент размещается? Похоже, что Вы просто неудачно пошутили:)

Avatar 0
[Удален]
#427
Estelle:
Извините, но я что-то не поняла: есть еще какой-то другой, отличный от шинглового, алгоритм проверки? Правда, первый раз слышу! Да и как мне известно, большинство тружеников бирж контента именно таким образом обрабатывают тексты, как вы тут описали! И что теперь, ПС низко оценивают те сайты, на которых их контент размещается? Похоже, что Вы просто неудачно пошутили:)

Да, у нас совершенно новый алгоритм проверки текста на уникальность.

В моем предыдущем сообщения шла речь о тех случаях, когда, к примеру, исполнители не потрудились качественно отрерайтить статью, а просто поменяли слова местами или кое-где изменили падежи. По сути это и не является рерайтом. У нас на бирже исполнители делают такой рерайт, что даже наша проверка уникальности выдает высокий процент.

E 50
#428
TEXT_RU:
Да, у нас совершенно новый алгоритм проверки текста на уникальность.
У нас на бирже исполнители делают такой рерайт, что даже наша проверка уникальности выдает высокий процент.

Безумно интересно узнать на чем же это основан этот Ваш "совершенно новый алгоритм"! И каким это образом Ваша "проверка уникальности выдает высокий процент"! Как говорится "каждый кулик свое поле хвалит"!))) Да будет ли известно Вам, Уважаемый, что даже само понятие "шингл" у разных программ антиплагиата (Etxt Antiplagiat vs Advego Plagiatus) трактуется немного по-разному - отсюда и некоторое различие в % уникальности при ОДИНАКОВОМ размере шингла! Шингл - это математика т.к. в данном случае вычисляется контрольная сумма текста, а с точными науками сложно спорить, не так ли? А на чем основан Ваш "совершенно новый алгоритм"? На интуиции? Или на гадании на кофейной гуще? Извините за ехидство, но я тоже могу заявить, что изобрела "совершенно новый алгоритм", не объяснив толком его сути!

---------- Добавлено 06.03.2013 в 20:00 ----------

Estelle:
Безумно интересно узнать на чем же это основан этот Ваш "совершенно новый алгоритм"! И каким это образом Ваша "проверка уникальности выдает высокий процент"! Как говорится "каждый кулик свое поле хвалит"!))) Да будет ли известно Вам, Уважаемый, что даже само понятие "шингл" у разных программ антиплагиата (Etxt Antiplagiat vs Advego Plagiatus) трактуется немного по-разному - отсюда и некоторое различие в % уникальности при ОДИНАКОВОМ размере шингла! Шингл - это математика т.к. в данном случае вычисляется контрольная сумма текста, а с точными науками сложно спорить, не так ли? А на чем основан Ваш "совершенно новый алгоритм"? На интуиции? Или на гадании на кофейной гуще? Извините за ехидство, но я тоже могу заявить, что изобрела "совершенно новый алгоритм", не объяснив толком его сути!

Цитата с Вашего сайта "....наш алгоритм обнаруживает плагиат и после перестановки слов, фраз и предложений местами". Выставив шингл равный 1 или хотя бы 2 такое и получите.

---------- Добавлено 06.03.2013 в 20:23 ----------

Так и есть: вставила для пробы 1 свой рерайт в text.ru - выдал очень низкий процент уникальности, но всё очень похоже на крайне малый размер шингла - только и всего!))) Вот что я хочу сказать, господа разработчики: Качественный уникальный контент - дело ОЧЕНЬ серьезное, так что пора уже приходить к какому-то ЕДИНОМУ стандарту определения этой самой уникальности, а не выдумывать "совершенно новые алгоритмы", пытаясь обскакать конкурентов! А мы, писаки уж как нибудь под этот единый стандарт да подстроимся - это уж не беспокойтесь!)))))

4 81
#429

Позвольте дилетантский вопрос. А какая вообще уникальность считается "достаточной"?

В кавычки взял потому что не совсем понимаю - для чего конкретно достаточно. По всей видимости могут быть варианты.

#430
4kusnik:
Позвольте дилетантский вопрос. А какая вообще уникальность считается "достаточной"?
В кавычки взял потому что не совсем понимаю - для чего конкретно достаточно. По всей видимости могут быть варианты.

Мне кажется где-то 80%. Да и зависит от самой работы, скорее всего.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий