Как защититься от парсинга ГСов в новостных агрегаторах?

123 4
V
На сайте с 02.08.2011
Offline
50
3869

Сабж, три гвно сайта аля

rsute.ru

wordyou.ru

therussiantimes.com

в наглую копируют парсером каждую новость (уникальную). Подскажите, как бороться с такими наглыми копипастерами? Часто обгоняют сайт в выдаче ТОП-1 (мой сайт молодой еще), а также в придачу выводят мою же новость в новостных лентах Яндекс-новости и Гугл-новости, чисто под копирку.

Что бы вы делали? жду ответов, спасибо!

ps - оригинальные тексты не работают

в тексте есть упоминание сайта

Нашел похожий топик, но там всё мертво /ru/forum/949540

TF-Studio
На сайте с 17.08.2010
Offline
334
#1

саппорт яндекс-новостей что ответил?

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
I
На сайте с 03.01.2016
Offline
46
#2

Нужно просто смириться с этим 🍿

V
На сайте с 02.08.2011
Offline
50
#3

Если бы они ответили, пока молчат. Написал им об этом 3 дня назад.

Яндекс вряд ли исключит их даже из ЯН.

Пока сам попытался найти, вот частые IP (почти ежедневные постоянные "посетители"):

66.102.9.23 ---20,939 26,831 540.73 МБ 25 Апр 2017 - 14:02

66.102.9.25 ---15,936 20,548 417.69 МБ 24 Апр 2017 - 22:36

66.102.9.27 ---15,529 19,776 390.81 МБ 23 Апр 2017 - 06:23

66.102.9.55 ---9,522 11,916 237.00 МБ 18 Апр 2017 - 20:48

66.102.9.59 ---9,333 11,683 227.48 МБ 18 Апр 2017 - 20:48

66.102.9.57 ---9,222 11,646 228.68 МБ 18 Апр 2017 - 20:48

66.102.9.16 ---5,087 6,661 138.67 МБ 25 Апр 2017 - 14:02

66.102.9.19 ---5,063 6,606 139.04 МБ 25 Апр 2017 - 14:00

66.102.9.32 ---3,739 4,743 95.67 МБ 21 Апр 2017 - 13:46

66.102.9.63 ---3,671 4,700 95.96 МБ 21 Апр 2017 - 13:45

66.102.9.35

Возможно ли это IP парсеров? Вроде как Калифорния, у меня сайт российский, траф из РФ преимущественно.

ivakol:
Нужно просто смириться с этим 🍿

Ну это удел слабых, тем более сайты тупо делают дубли. Все равно есть лазейка в таких схемах, чтобы избавиться от них.

Вы бы вряд ли просто так смирились, чтобы ваш сайт каждый день копировали?

Вот и я не намерен)

ps - это айпишники Гугла, отбой тревоги, уже банить хотел их 🙅

U
На сайте с 09.04.2015
Offline
28
#4

Vadimts, нет, это гугловские адреса. Ищите дальше.

Samail
На сайте с 10.05.2007
Offline
361
#5

Vadimts, напиши им, попроси не парсить твой сайт иначе будешь подсовывать им материалы экстремистского содержания, а потом жаловаться.

V
На сайте с 02.08.2011
Offline
50
#6

Дальше искать становится проблематично, т.к IP-шников каждый день по 50.000+

Да и определить их просто нереально.

Если сделать запрет в Htacess по реферреру rsute.ru, скорее всего не поможет же?

Samail:
Vadimts, напиши им, попроси не парсить твой сайт иначе будешь подсовывать им материалы экстремистского содержания, а потом жаловаться.

Там контактная информация фейковая, да и игнорят они письма. Кстати, они как-то выборочно парсят. Могут 2 новости пропустить (только на моем сайте встречается текст), зато потом сразу 5 (проверяю на уникальность)

Xammer2000
На сайте с 10.08.2011
Offline
188
#7

Парсят с фото?

Самый удобный сервис комментов и репостов ( http://qcomment.ru/ref/123163 ) Позиции и апдейты проверяю тут ( https://tinyurl.com/tvefbe4 )
V
На сайте с 02.08.2011
Offline
50
#8
Xammer2000:
Парсят с фото?

Без фото, фотографии добавляются как будто руками (другие по теме), но скорее всего тоже автоматически

Xammer2000
На сайте с 10.08.2011
Offline
188
#9

Это плохо, нас тоже парсят и мы забили... сделать с этим ничего нельзя, банили и писали и потом много новых сайтов появляется

K
На сайте с 13.09.2015
Offline
48
#10

Сори за офтоп, если что, может кому сгодится. wordyou.ru был выставлен на телдери (telderi.ru/ru/viewsite/558671) и наверно кто то его купил. Там был до этого какой то некрасивый сайт на вордпрессе про ислам и, если не ошибаюсь, он находился в гогете, ну по ссылке телдери там описано. Как его продали он получил АГС от яндекса, но снова смотрю уже его нет.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий