Как определять уникальность контента ?

12
KV
На сайте с 03.10.2007
Offline
7
1346

Доброго времени суток.

Почитал форум про различные методики определения уникальности контента, но на свой вопрос так и не нашел ответа...

Дело в том, что я хочу закать копирайтеру написать мне около 100 статей на сайт. Но боюсь, что они откуда-нибудь украдет или просто сделает плохой рерайт. Хотелось бы проверить его работу путем написания своего скриптика на сервере, который бы проверял текст на уникальность.

Скажите пожалуйста, каков алгоритм проверки на уникальность ?

P.S. Я так понимаю, что надо брать какие-то части текста и делать запросы в Яндекс. Вопрос в том, какие части текста брать и какие запросы делать...

[Удален]
#1

Используйте метод шинглов.

[Удален]
#2

Не туда...не правильно...сообщение удалить можно.

KV
На сайте с 03.10.2007
Offline
7
#3
Asklepiy:
Используйте метод шинглов.

Это я все читал... Вопрос в другом: как конкретно делать ? То есть, брать по 10 слов из текста и вбиваить их в Янкдекс ?

Kesha V добавил 01.06.2008 в 21:14

KirillK:
Antiplagiat.ru или лучше программка

Скачать и сказать спасибо :)

DCFinder я видел. Но он десктопный, а хочется на серваке.

Walik
На сайте с 08.01.2008
Offline
75
#4

Ещё есть http://copyscape.com/

-=Spirit=-
На сайте с 03.02.2008
Offline
144
#5
Walik:
Ещё есть http://copyscape.com/

Наверно, наиболее идеальный вариант.

Закидываете текст себе на сайт и проверяете, если что-то подобное в и-нете уже есть - обязательно найдет.

✔ Разработка и доработка сайтов на любых CMS, самописные решения. Опыт более 5 лет. (/ru/forum/863452)
KV
На сайте с 03.10.2007
Offline
7
#6
Walik:
Ещё есть http://copyscape.com/

Там, как я понял, можно только адрес указать, что проверять. Для моей задачи не совсем подходит, потому что статью надо выложить перед тем как проверить на плагиат, а потом убрать.

Kesha V добавил 01.06.2008 в 21:25

-=Spirit=-:
Наверно, наиболее идеальный вариант.

Закидываете текст себе на сайт и проверяете, если что-то подобное в и-нете уже есть - обязательно найдет.

Я попробовал "поиграться" с этой системой... Достаточно интересно работает, однако, я так и не нашел ни одного сайта, для которого хотя бы частично не находились дубли :)

[Удален]
#7
Kesha V:
Я попробовал "поиграться" с этой системой... Достаточно интересно работает, однако, я так и не нашел ни одного сайта, для которого хотя бы частично не находились дубли :)

А в Яндексе или Гугле эти дубли определялись? :)

KV
На сайте с 03.10.2007
Offline
7
#8
Asklepiy:
А в Яндексе или Гугле эти дубли определялись? :)

А я не знаю как это сделать :) В общем-то это и есть мой первоначальный вопрос: как определить уникальность текста с помощью Яндекса и Гугля :)

Сеодром
На сайте с 27.11.2007
Offline
187
#9

Обратитесь к разработчикам программы DCFinder. Возможно, они раскроют вам свой алгоритм определения уникальности контента по яндексу. Кстати, по гуглу программа иногда ошибается...

На этой партнёрке я получаю немного баксов в неделю , зато постоянно: https://goo.su/z9gsI2
KV
На сайте с 03.10.2007
Offline
7
#10
Сеодром:
Обратитесь к разработчикам программы DCFinder. Возможно, они раскроют вам свой алгоритм определения уникальности контента по яндексу. Кстати, по гуглу программа иногда ошибается...

Ну что касается этой программы, то и та можно сниффером посмотреть, какие она делает запросы и че как. Просто интересно, есть ли описание алгоритма как такового и есть ли уже готовые программные решения, которые можно использовать.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий