При определенных условиях автограббера можно подтвердить права на сайт с чужого домена - Безопасность

Полная копия сайта, автограббер, что делать?

untee · 2015-10-26T17:16:40.0000000Z

Обнаружил полную копию сайта на другом домене. Публикации на этом сайте появляются автоматически, сразу же после их появления у меня. Есть несколько интересных нюансов: - графика не импортируется на чужой хост. Ссылки на всю графику всегда с сайта-оригинала. - сайт-копия получает трафик, причем не связанный с моим контентом и моим трафиком, хотя тематика общая. Это видно по метрике, код которой тоже остается на сайте-копии. - нагуглил целую сеть таких сайтов http://domainbigdata.com/email/e5y78hurdvcbyr537hjkps@mail.ru Все они сделаны по одной формуле, описанной выше. Оригинальный сайт можно узнать по урлу с любой картинки в любом посте. Главный вопрос: как от этого защитится? Или хотя бы усложнить жизнь тому, кто создает такие копии? Я пробовал блокировать IP хоста в htaccess, но результата не дало. Буду благодарен за советы.

1609

SeVlad

8 ноября 2015, 17:20

#31

tomat_ok:
Все как обычно, заходишь в вебмастер добавляешь домен клона, скачиваешь файл подтверждения, заливаешь его на свой хостинг, нажимаешь проверить в вебмастере и все.

И как гугловебмастер его получит с чужого домена? Как этот файл окажется на нём? Откуда парсер узнает его урл?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.

KU

251

Vitalii Polishchuk

8 ноября 2015, 17:28

#32

SeVlad:
И как гугловебмастер его получит с чужого домена? Как этот файл окажется на нём? Откуда парсер узнает его урл?

SeVlad, вы не поняли, сайт-клон на лету берет контент запрашиваемых страниц с сайта донора. Он не хранит контент у себя. Взял - передал - забыл. Типичный прокси.

Делая запрос GET http://сайт-клон/файл_подтверждения

в access логе сайта донора появляется запись GET http://сайт-донор/файл_подтверждения с IP адреса сервера, где размещен сайт-копия.

1

Хостинг ( https://good-host.net ) / Linux VPS ( https://good-host.net/vps ) / Windows VPS ( https://good-host.net/windows-vps ) / Выделенные серверы ( https://good-host.net/dedicated ) 14 лет онлайн!

Mediapartners-Google запрашивает неправильные url Это кошмар какой-то. У Проксируют сайт

1609

SeVlad

8 ноября 2015, 17:39

#33

KM.UA:
SeVlad, вы не поняли, сайт-клон на лету берет контент с сайта домена. Он не хранит контент у себя.

KM.UA, может хранинь, может не хранить - смотря какой/как/для чего. Но тред НЕ ОБ ЭТОМ ЖЕ!!!. И не о логах на доноре.

Речь о подтверждении ЧУЖОГО домена (поддомена, если точнее) в гугловебмасте. Я уже даже опускаю, что в изначальной ситуации камрад не имеет базовых знаний сисадмина (логи и тп не смотрелись) и пр:

superf:
зашел в гугл вебмастер, как вебмастер этих сайтов, подтвердил права на сайты
...
Для подтверждения, файлик разместил на своем сайте, и этого оказалось достаточно, чтоб гугл посчитал что те сайты мои..

Весь вопрос сводиться к: Как можно отдать гуглу файл чужого домена, если на него нет (никто не делал) ссылок? Т.е. этот файл граббер не увидит и файл на домен парсера не попадёт.

---------- Добавлено 08.11.2015 в 20:45 ----------

KM.UA:
Делая запрос GET http://сайт-клон/файл_подтверждения
в access логе сайта донора появляется запись GET http://сайт-донор/файл_подтверждения с IP адреса сервера, где размещен сайт-копия

Хм.. А вот это уже вариант интересный. Надо обдумать.

---------- Добавлено 08.11.2015 в 20:51 ----------

SeVlad:
Надо обдумать.

Да, согласен, при определённых условиях это может сработать.

Какой из трёх видов Перевод сайта на русскую Вопрос по статейному продвижению

S

162

superf

8 ноября 2015, 18:38

#34

На самом деле подтверждение в вебместере гугла таких сайтов копий работает, только что проверил. Тоже есть такой сайт клон, который полностью копирует весь контент на другом домене. Причем даже файл роботс у него такой же.

- так не поверят же, скажут что сказочник :-)

1609

SeVlad

8 ноября 2015, 18:53

#35

superf:
так не поверят же, скажут что сказочник

Без доказательств или объяснений процессов - да :) (думаешь, мало тут сказочников? ;)).

Но спокуха! По наводке KM.UA (за что ему очередной респект и уважуха) я ж признаю, был где-то не прав:

SeVlad:
согласен, при определённых условиях это может сработать.

Когда приводятся толковые аргументы - только недалёкий(ая) будет их не учитывать.

Сайт с бесплатными базами GoGetLinks.net: ссылки навсегда на Яндекс.Дзен. Часть 8

L

351

Ladycharm

8 ноября 2015, 20:31

#36

SeVlad:
Я уже даже опускаю, что в изначальной ситуации камрад не имеет базовых знаний сисадмина (логи и тп не смотрелись) и пр:
. . .
Весь вопрос сводиться к: Как можно отдать гуглу файл чужого домена, если на него нет (никто не делал) ссылок? Т.е. этот файл граббер не увидит и файл на домен парсера не попадёт.

У этих "комрадов" такая сообразительность и природная смекалка, что сисадмины с их "базовыми знаниями" нервно курят в сторонке.

Вон, superf сразу сказал что надо сделать, и никакие логи ему не потребовались.

В топике ещё на первой странице чётко объяснили как работает этот вариант автограббера.

Пост untee:

Публикации на этом сайте появляются автоматически, сразу же после их появления у меня

Явно же не в онлайн режиме автограббер сканирует сайт-жертву.

Пост korchik:

И происходит это в момент обращения страницы на клоне сайта
. . .
Ищем какую-нибудь не популярную страничку на своём сайте, меняем своё имя домена на имя домена клона и загружаем в браузере пару раз, при этом запоминаем время обращения к данной странице (для упрощения поиска в логе).

и подробно расписал нюансы работы и что смотреть в логах сервера. Сразу видно, что человек про граббинг знает не по наслышке.

2

Странные реальные посетители которых Открытое письмо к Yandex Подскажите по улучшению юзабилити

727

MoMM

8 ноября 2015, 21:01

#37

SeVlad, Ladycharm дело описывает. Вражеский сайт не парсит все заранее и не хранит на диске. Когда вебмастер родного сайта вносит вражеский домен в ВМТ гугла, то получает файл абв.тхт. Он размещает на родном сайте абв.тхт и кликает в ВМТ "подтвердить". Гугл запрашивает вражескийдомен/абв.тхт, а там такого нет, но тут же включается парсер и дергает абв.тхт к себе на вражеский домен и отдает гуглу. Происходит подтверждение прав вебмастера родного домена на вражеский домен.

1

mod_rewrite, замена букв. Убрать страницы из Гугл-кеша. Письмо от R01: подтверждение

1609

SeVlad

8 ноября 2015, 21:03

#38

MoMM, /ru/forum/comment/14110568

1

TO

47

tomat_ok

9 ноября 2015, 15:37

#39

Вот кстати еще она фишка. Можно сделать редирект с сайта клона на свой. Так весь трафик, который собирает клон будет идти на ваши страницы.

Вот условия для .htaccess (у меня работает)

RewriteCond %{HTTP_HOST} ^siteklon\.ru [NC]

RewriteRule ^(.*)$ http://vashsite.ru/$1 [R=301,L]

4

переезд сайта на другой Подскажите с 301 редирект Как сделать редирект (301,

U

28

umercomp

9 ноября 2015, 16:21

#40

MoMM:
SeVlad, Ladycharm дело описывает. Вражеский сайт не парсит все заранее и не хранит на диске. Когда вебмастер родного сайта вносит вражеский домен в ВМТ гугла, то получает файл абв.тхт. Он размещает на родном сайте абв.тхт и кликает в ВМТ "подтвердить". Гугл запрашивает вражескийдомен/абв.тхт, а там такого нет, но тут же включается парсер и дергает абв.тхт к себе на вражеский домен и отдает гуглу. Происходит подтверждение прав вебмастера родного домена на вражеский домен.

Вы всерьез полагаете, что, зная имя файла подтверждения, можно подтвердить права на сайт с ДРУГОГО домена?

tomat_ok, а с какой стати при обращении к клону будут выполняться инструкции Вашего .htaccess?

Что делать, если ваша email-рассылка попала в спам

Дзен реализовал для авторов возможность вывода денег через СПБ

Полная копия сайта, автограббер, что делать?