Чем определить уникальность текстов для целого сайта?

12
Павел Горбунов
На сайте с 13.06.2011
Offline
123
1093

Коллеги, поделитесь, пожалуйста, опытом - кто чем смотрит уникальность текстов в рамках целого сайта?

Предположим, на N страниц сайта тексты уникальные, на M - скопированные. Чем можно определить список таких страниц с дублированными текстами?

Не стремитесь сделать лучше - улучшайте!
genjnat
На сайте с 08.10.2008
Offline
228
#1

Ничем я думаю. Кроме

"сюда копируете кусок текста и берете в кавычки" site:вашсайт.ru

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#2
genjnat:
Ничем я думаю. Кроме
"сюда копируете кусок текста и берете в кавычки" site:вашсайт.ru

Так это - способ для страницы.

Не для множества страниц.

Он априори не подходит для такой задачи.

genjnat
На сайте с 08.10.2008
Offline
228
#3

Это способ найти дубли данного текста на всех проиндексированных страницах.

Других полагаю нет.

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#4
genjnat:
Это способ найти дубли данного текста на всех проиндексированных страницах.
Других полагаю нет.

ну если бы все задачи вручную выполнялись, я бы не задавал этот вопрос.

Методы есть, но нужно их искать.

genjnat
На сайте с 08.10.2008
Offline
228
#5

Нету их. Вы себе саму задачу представьте...

Для начала вы хрен найдете хоть один сервис/прогу, которая сможет корректно вычленить сам текст, не трогая все остальное на странице. Плюс должно проверять на уник в промышленных масштабах, плюс именно в рамках сайта... Это не считая всяких мелочей, как например учитывать настройки индексации.

Но, ищите конечно...

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#6
genjnat:
Нету их. Вы себе саму задачу представьте...
Для начала вы хрен найдете хоть один сервис/прогу, которая сможет корректно вычленить сам текст, не трогая все остальное на странице. Плюс должно проверять на уник в промышленных масштабах, плюс именно в рамках сайта... Это не считая всяких мелочей, как например учитывать настройки индексации.
Но, ищите конечно...

Да уже нашел.

Есть такие проверки у https://content-watch.ru/ и у https://text.ru/.

Надо понять, на каком объеме они работают бесплатно.

Но для некоторых случаев подходит и проверки списка страниц. поэтому хватит и бесплатной версии.

genjnat
На сайте с 08.10.2008
Offline
228
#7

Ну нашли так нашли, удачи с проверкой :)

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#8
genjnat:
Ну нашли так нашли, удачи с проверкой :)

Вот еще такой вариант нашли - http://www.siteliner.com/.

Можно пробовать.

genjnat
На сайте с 08.10.2008
Offline
228
#9

Вы ничего не нашли, и не найдете.

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#10
genjnat:
Вы ничего не нашли, и не найдете.

Ну вам-то виднее, что я нашел.

Вы же не только свою работу, но и мою лучше знаете.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий