Как защититься от парсинга ГСов в новостных агрегаторах?

123 4
TP
На сайте с 19.04.2017
Offline
4
#11

можно ограничить запросы с одного ip, можно куки и gs настроить. можно капчу поставить. все это затруднит парсинг.

Предлагаю услуги ПАРСИНГА сайтов (http://tizelpizel.blogspot.ru/) Извлечение любой информации - товаров, контактов, текстов. Напишу парсеры для наполнение и автоматической синхронизации сайтов. Интеграция парсеров с базами данных.
I
На сайте с 03.01.2016
Offline
73
#12

как вариант можно генерировать слово(используя IP клиента) где-то в тексте, потом уже на их сайте "спалить" айпишник парсера

V
На сайте с 02.08.2011
Offline
50
#13

Попробую прям в конце текста добавить определитель IP.

Что-то типа: "текст текст текст 127.0.0.0.1 текс текст текст"

О результатах отпишусь

Для тех, кому интересно и возможно такая же проблема, то:

1) создал файл ip.php с кодом

<?php

echo $_SERVER['REMOTE_ADDR'];

?>

2) в DLE fullstory.tpl после {full-story} добавил {include file="/ip.php"}

I
На сайте с 03.01.2016
Offline
73
#14
Vadimts:
Попробую прям в конце текста добавить определитель IP.
Что-то типа: "текст текст текст 127.0.0.0.1 текс текст текст"

О результатах отпишусь

Для тех, кому интересно и возможно такая же проблема, то:

1) создал файл ip.php с кодом
<?php
echo $_SERVER['REMOTE_ADDR'];
?>

2) в DLE fullstory.tpl после {full-story} добавил {include file="/ip.php"}

желательно зашифровать ip и "спрятать" в тексте :) Иначе толку от такой "защиты" будет мало...

V
На сайте с 02.08.2011
Offline
50
#15
ivakol:
желательно зашифровать ip и "спрятать" в тексте :) Иначе толку от такой "защиты" будет мало...

Да они даже упоминания сайта не удаляют, вряд ли и циферки заметят. У меня в тексте новости идет так:

"бла бла бла бла сообщает moisait.ru бла бла бла". И на всех трех сайтах слово "moisait.ru" также парсится без изменений.

Еще появилась идея запатентовать (или другое название) БД сайта, получить свидетельство о регистрации базы данных, а потом смело жаловаться хостингу + РКН + DMCA. Кто-то такое делал уже?

TF-Studio
На сайте с 17.08.2010
Offline
334
#16

нечего не выйдет.

парсят всех и всегда. за все годы существования.

расслабьтесь. работайте над своим сайтом

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
R
На сайте с 05.07.2014
Offline
21
#17
TF-Studio:
нечего не выйдет.
парсят всех и всегда. за все годы существования.
расслабьтесь. работайте над своим сайтом

Совет от копипастера? 🙅

Не расслабляйтесь! Это сетка одного владельца. Пишите в первую очередь в Адсенс, Яндекс.Директ, жалуйтесь в Гугл и Яндекс.

Пишите владельцам других пострадавших сайтов. Можно коллективную жалобу накатать.

TF-Studio
На сайте с 17.08.2010
Offline
334
#18

я не копипастер. я разработчик.

и я просто развиваю ресурсы, вместо того, чтобы тратить время на борьбу с мельницами

B
На сайте с 13.02.2008
Offline
262
#19

Проблем нет с созданием им неприятностей. Как выше написали, вам надо сначала их ip вычислить, а дальше их сайты по сути под вашим управлением находятся :)

Vadimts:
Да они даже упоминания сайта не удаляют

Может не всё так плохо для вас? Если они не вытесняют в выдаче ваши страницы своими, то цитирование вашего сайта (даже без активной ссылки) является положительным фактором для вас.

OI
На сайте с 05.03.2011
Offline
109
#20

Вставляйте в текст свою ссылку. Или поставьте скрипт который при отдаче контента прикрепляет ссылку. Я вас уверяю текста там парсят и не проверяют. А будет ссылка пусть даже неактивная, гугл поймет. А и для вас это сигнал..значит ваш сайт проигрывает гс. Просто так не ставят выше. При написании новой статьи сразу индексируйте ее через вебмастер.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий