Чем определить уникальность текстов для целого сайта?

12
genjnat
На сайте с 08.10.2008
Offline
229
#11
Павел Горбунов:
Ну вам-то виднее, что я нашел.

Ни один из сервисов что вы запостили, не проверяет уникальность В РАМКАХ САЙТА. Т.е. не ищет дубли.

И даже общую по списку урл они вам коректно не покажут, потому что тупо не умеют корректно вычленять текст для анализа. Или только в случаях когда он начинается и заканчивается каким-то уникальным тегом.

В свое время нужно было для всего сайта не то чтоб уникальность, а просто, сам факт наличия текста и его объем определить. И я ничего не нашел.

Павел Горбунов
На сайте с 13.06.2011
Offline
123
#12
genjnat:
Ни один из сервисов что вы запостили, не проверяет уникальность В РАМКАХ САЙТА. Т.е. не ищет дубли.
И даже общую по списку урл они вам коректно не покажут, потому что тупо не умеют корректно вычленять текст для анализа. Или только в случаях когда он начинается и заканчивается каким-то уникальным тегом.

В свое время нужно было для всего сайта не то чтоб уникальность, а просто, сам факт наличия текста и его объем определить. И я ничего не нашел.

так тут может любой текстовый анализатор помочь.

с корректным вычлененнием всего текста - да, я понял мысль, могут возникнуть сложности.

Но когда весь текст - несколько абзацев подряд, любой сервис его найдет.

Не стремитесь сделать лучше - улучшайте!
Павел Горбунов
На сайте с 13.06.2011
Offline
123
#13

По итогам проверки могу сказать, что действительно есть проблемы, если тексты расположены в разных блоках.

Если только 1 текстовый блок на странице (например, статья), проблем не возникает.

Лучше всего, на мой взгляд, решили эту проблему в text.ru:

можно обрамить нужный контент комментариями <!-- TEXT -->и <!-- /TEXT -->.

тогда их сервис рапознает все текстовые блоки.

не самое лучшее, но все же - решение.

SergejF
На сайте с 07.06.2008
Offline
642
#14
Павел Горбунов:
не самое лучшее, но все же - решение.

И как это решение работает со всеми страницами сайта?

Momenta... Этнографические заметки: http://www.sbible.ru/vasil1.htm
Павел Горбунов
На сайте с 13.06.2011
Offline
123
#15
SergejF:
И как это решение работает со всеми страницами сайта?

посмотрите, тут объяснение ничего не даст, пока не увидишь сам.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий