WP Content Guard – защита контента на вашем блоге. Нужны бета-тестеры.

12
Q
На сайте с 23.02.2009
Offline
81
1402

Добрый день, уважаемые форумчане.

Нужна ваша помощь в тестировании одного небольшого WP плагина, который призван решить проблему воровства контента с ваших блогов.

Описание проблемы:

Воровство контента с блогов на WP. В большинстве случаев контент парсится через RSS-ленту и публикуется на сторонних сайтах до индексации на основном. Причина – отпарсить четко структурированную xml-ку RSS-ленты, зачастую проще, чем html-блога. Подтверждение предположения - http://gyazo.com/21debfc3d96de67308bd89fc89a82f56.png.

Решение проблемы:

Не отдавать посты в RSS-ленту до того момента, как их не заберут роботы ПС. Проверяем user-agent, а затем IP что бы исключить подмену. Как только роботы ПС посещают RSS-ленту, открываем ее для всех.

Другие возможности плагина:

- простановка копирайтов в теле контента и в RSS;

- запрет на копирование через правую кнопку мыши, на самом блоге(опционально);

- сбор статистики посещаемости RSS-ленты поисковыми роботами;

- блокировка ботов с user-agent, которые находятся в черном списке.

Пара принскринов:

http://gyazo.com/ebd8c9d39e18350046f2eb2cd2389087.png

http://gyazo.com/7f6e1dc007cb08c9a7e494fd059ad67b.png

С небольшой презентацией закончили, теперь к делу. Нужно 5 добровольцев, которые готовы не откладывая в долгий ящик установить плагин на работающий блог. Проверить его работоспособность, написать свои пожелания и замечания.

Заранее спасибо.

С уважением, Алексей.

KPD Tourismus - удобный инструмент для работы с туристическим трафиком (http://goo.gl/QqMRmc) Красивые иллюстрации (http://goo.gl/2doR1Q) для вашего сайта. LetUSindex.com – ускорение индексации (http://goo.gl/M3taZ8)
О
На сайте с 08.06.2011
Offline
113
#1

готов попробовать...

Сервис автоматического размещения рекламы в социальных сетях (https://clck.ru/CwRFB)
Q
На сайте с 23.02.2009
Offline
81
#2

для всех желающих помочь нам в тестировании плагина, сбрасывайте в ЛС:

- свою почту;

- icq или скайп для оперативной связи;

- ссылку на блог, на который будет размещен плагин.

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#3

Ну ок, буду парсить с самого сайта.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
Q
На сайте с 23.02.2009
Offline
81
#4

LEOnidUKG, конечно есть другие способы парсинга, кто бы спорил.

Речь идет о том, что бы на первом этапе перекрыть доступ к самому простому из них - парсинг структурированной RSS-ки. Пройдем этот этап, перейдем к защите самого сайта. Там свои нюансы, но это позже. Пока RSS

TF-Studio
На сайте с 17.08.2010
Offline
334
#5

Нереально защититься от парсинга.

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#6
qqqwww:
LEOnidUKG, конечно есть другие способы парсинга, кто бы спорил.
Речь идет о том, что бы на первом этапе перекрыть доступ к самому простому из них - парсинг структурированной RSS-ки. Пройдем этот этап, перейдем к защите самого сайта. Там свои нюансы, но это позже. Пока RSS

т.е. вы реально считаете, что если ПС скушает первая текст, а только потом парсер, то жертва не пострадает? 🍿

Полон мир наивных людей.

---------- Добавлено 06.11.2012 в 00:34 ----------

TF-Studio:
Нереально защититься от парсинга.

Реально, если не выкладывать в интернет, а хранить у себя в сейфе тексты. 🤪

Q
На сайте с 23.02.2009
Offline
81
#7

LEOnidUKG, у вас есть примеры удачных сайтов, которые живут за счет спарсенного не уникального контента? Присылайте в личку, продолжим дискуссию там, так как ваши философские умозаключения уводят тему в глубокий офтоп.

TF-Studio, не стоит быть столь категоричными. В большинстве случаев достаточно "поднять планку входа", что бы решить возникшую проблему. Яркий пример - простенькая капча, распознать которую толковому программисту не составит труда - практически полностью решает вопрос спама.

Как бы то ни было, тема не подразумевает обсуждение продукта, который даже бету не прошел. Цель топика поиск бета-тестеров, есть желание помочь - отлично оставляйте контакты.

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#8
Q
На сайте с 23.02.2009
Offline
81
#9

Леонид, перед тем как давать ссылку посмотрите каким числом датируются результаты выдачи.

И еще раз прошу, хотите продолжить дискуссию - пишите в ЛС. Прекратите офтопить.

Нямкин
На сайте с 02.12.2010
Offline
65
#10
qqqwww:

Не отдавать посты в RSS-ленту до того момента, как их не заберут роботы ПС.

Функционалом движка предумотренна отдача только анонса с определенным количеством знаков.

qqqwww:

- простановка копирайтов в теле контента и в RSS;

После парсинга боты чистят контент от внешних ссылок.

qqqwww:

- запрет на копирование через правую кнопку мыши, на самом блоге(опционально);

Это этого побегут не столько копипастеры, сколько живые юзеры.

У меня есть мысль, как оставить право первого индексирования за своим сайтом. Дарю идею:

После того, как статья сабмитится на сайт, ей присваивается url, по которому пост становится доступным. Но сам адрес не появляется нигде - ни на главной сайта, ни в rss-ленте, ни в сайтмапе. Вообще нигде. Адрес отправляется в аддурилку. И только после появления в индексе пост появляется на сайте в ленте, rss и т.д.

Вариант добавления в индекс не через аддурилку (ибо там капча): сайтмапу присвоить произвольное имя и не занося его положение в роботс, добавить прямо в ЯВМ и ИВМ. Как результат - о сайтмапе будут знать только поисковики.

Удачи. Хорошее начинание.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий