Массовая проверка контента на уникальность

12
[Удален]
#11

http://searchcopy.ru/ я тут проверяю лично. быстро, удобно и качественно. А самое главное - доступно и дешево.

A
На сайте с 17.09.2008
Offline
123
#12
IV-й:
Здравствуйте.
О необходимости проверки контента сайта на уникальность говорить не стану, буду краток:
1) Подскажите софтину или сервис, который позволяет осуществлять массовую проверку контента всего сайта, или скажем выделенных под анализ разделов, на уникальность.
2) Если такого чуда в природе нет ещё, то как вы решаете данную задачу? Не в ручную же несколько десятков, а то и тысяч страниц перебирать.

Надеюсь, что проблема общая, и тема будет полезна.

Заранее благодарен.

ЗЫ: сильно не пинать

Продам самописную софтину на C#. Проверяет через Яндекс. Ищет каждое предложение в "кавычках". Предложение выделяет желтым, если нашло - неуник, иначе зеленым - уник, если не нашло.

Прошу 50$. Работает в потоках. Можно через прокси, если прокси из бесплатных списков, то обычно много умерших, и выходит примерно 1000 проверок за 30-40 мин. Можно через Яндекс.XML - на порядок быстрее.

Использовал для своих нужд, проверял по несколько тыс. предложений в сутки через прокси. Могу подключить через XML, если надо. Только потребуется немного времени.

vtomas
На сайте с 19.03.2007
Offline
102
#13
andrush:
Ищет каждое предложение

А как же разбиение контента на пресловутые шинглы или пассажи?

Хорошее стоит дорого, на плохое не стоит и тратиться. В поисках VPS захостился здесь (http://ipserver.su), а бэкапы храню здесь (http://billing.markovservers.com/backup/pl.php?65).
A
На сайте с 17.09.2008
Offline
123
#14
vtomas:
А как же разбиение контента на пресловутые шинглы или пассажи?

К сожалению на пресловутые шинглы или пассажи не разбивает. Делит просто на предложения, разделители - точка, !, ?, ... . Для моих нужд этого было достаточно. Можно конечно будет доработать разбивку, но это немного позже. Сейчас совсем времени нет.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий