Изменения в text.ru

1 234
Vauquelin
На сайте с 02.09.2012
Offline
9
#21

Объясните, как он проверят уникальность? Вот список подсвеченного текста статьи:

прочности кладки стены

стены

В зависимости от

требований к

она может быть

Получается, слово "стена", словосочетание "В зависимости от" и тд считаются плагиатом что ли?

[Удален]
#22

Vauquelin, нет, алгоритм не считает отдельные слова не уникальными, только сочетание слов. Если бы в тексте отдельно встречались слова "стена", фразы "в зависимости от", "требований к", то на них не обратилось бы внимание. Но они стоят вместе и поэтому в сети был найден текст, в котором эти слова таким же образом соседствуют.

MM
На сайте с 02.03.2011
Offline
19
#23

Я долго пользовался этим сервисом, пока ни "попал". Показал, что уник 100%, а заказчик вернул статью, написал, что там меньше 80%. Я проверил еще раз - и правда! Быстренько переделал, статью приняли, но заказчика потерял.

Теперь перешел на Advego. А проверять и там и там, только время терять. Зачем такие сервисы нужны?

Элизабет
На сайте с 24.03.2011
Offline
187
#24

Я проверяла на днях "туристический" текст на восемь тысяч знаков. Средняя уникальность в основных программах проверки - 95-98 процентов, в text.ru - 69. Наибольший процент совпадений в рамках одного сайта составил 14 процентов. Заглянула на сайт - естественно, там стоял совсем другой текст. Совпадения обнаруживались только на фоне названий достопримечательностей, улиц, районов города, дат и их обиходных названий. Можно, конечно, было бы всё это убрать, но тогда текст превратился бы в мало информативный.

Алгоритм может быть и неплохой, но... вызывающий некоторое замешательство.

Кошачий
На сайте с 12.10.2012
Offline
116
#25

Говносервис... как я понял, смотрит только по яндексу совпадения. Начал проверять текст с кл. сайта под АГС, он уникальным оказался 😂 в гугле по отрывку ищет.

Когда планета покроется котиками, она станет мягкой и пушистой ▲_▲ ▲_▲ Котосмайлы () на котофорум (/) ▲_▲
[Удален]
#26
mr.media:
Я долго пользовался этим сервисом, пока ни "попал". Показал, что уник 100%, а заказчик вернул статью, написал, что там меньше 80%. Я проверил еще раз - и правда! Быстренько переделал, статью приняли, но заказчика потерял.
Теперь перешел на Advego. А проверять и там и там, только время терять. Зачем такие сервисы нужны?

Уникальность - это динамическая величина. По некоторым причинам, связанным с выпадением ссылок из поисковой выдачи или, к примеру, недоступностью сайта на момент проверки, при разных проверках может показываться разный процент. Это внешние причины, никак не связанные с самим алгоритмом. Поэтому всегда лучше проверять текст 2 раза, ну или как вариант пользоваться сразу несколькими сервисами.

Элизабет:
Я проверяла на днях "туристический" текст на восемь тысяч знаков. Средняя уникальность в основных программах проверки - 95-98 процентов, в text.ru - 69. Наибольший процент совпадений в рамках одного сайта составил 14 процентов. Заглянула на сайт - естественно, там стоял совсем другой текст. Совпадения обнаруживались только на фоне названий достопримечательностей, улиц, районов города, дат и их обиходных названий. Можно, конечно, было бы всё это убрать, но тогда текст превратился бы в мало информативный.

Алгоритм может быть и неплохой, но... вызывающий некоторое замешательство.

Для некоторых текстов (например, туристических, медицинских, юридических, строительных и т.д.) нормальная уникальность по нашему алгоритму - от 70%. Эти 30% закладываются на случай использования в текстах цитат, названий, специальных терминов, т.е. тех слов, которые нельзя изменить без потери смысла. Поэтому в вашем случае уникальность нормальная, и исправлять или убирать названия, даты и т.д. нет необходимости.

Кошачий:
Говносервис... как я понял, смотрит только по яндексу совпадения. Начал проверять текст с кл. сайта под АГС, он уникальным оказался 😂 в гугле по отрывку ищет.

Если есть конкретные замечания по поводу проверки уникальности текста, то скидывайте результаты проверки нам на почту support@text.ru

Элизабет
На сайте с 24.03.2011
Offline
187
#27
TEXT_RU:

Для некоторых текстов (например, туристических, медицинских, юридических, строительных и т.д.) нормальная уникальность по нашему алгоритму - от 70%. Эти 30% закладываются на случай использования в текстах цитат, названий, специальных терминов, т.е. тех слов, которые нельзя изменить без потери смысла. Поэтому в вашем случае уникальность нормальная, и исправлять или убирать названия, даты и т.д. нет необходимости.

Спасибо за ответ. Никогда бы не догадалась, что ваш алгоритм работает настолько интересно. Я, конечно, проверяю всё, что у меня вызывает сомнения вручную, но всё-таки такие цифры периодически вгоняют меня в ступор. Ладно, привыкну со временем. :)

toboom
На сайте с 14.05.2013
Offline
58
#28

Как следует из некоторых косвенных факторов, пользователь TEXT_RU является представителем администрации. Отсюда вопросы по адресу:

1) Можно ли всё-таки более серьёзно описать, представить механику работы проверки уникальности, чтобы народ не шарахался от паники до недоверия и неприятия?

2) Можно ли, наконец, дать этому новому алгоритму название? Мне, к примеру, уже надоело писать про "новый". Поэтому в своём блоге название придумал - корреляционный алгоритм (http://www.toboom.name/2013/04/text-ru-content-watch-ru.html). Но прав ли я? Точно ли это название?

3) Имеются ли принципиальные отличия алгоритмов тектсру и контентватч?

Думаю и пишу тексты
AB
На сайте с 16.11.2011
Offline
78
#29

отличный сервис.. сразу показывает кто из райтеров меняет структуру текста, а кто слова местами меняет да синонимы использует..

A
На сайте с 05.08.2011
Offline
34
#30
AndreyBR:
отличный сервис..

был до обновления, которое случилось несколько месяцев назад. В настоящее время - проверка на уникальность в некоторых случаях не выявляет копипасту двухнедельной давности. Так что приходится пользоваться аналогом. Но для проверки больших объемов текста можно использовать.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий