Кто-то сможет объяснить как это возможно, но только при беспросветной глупости пользователя - Безопасность

Полная копия сайта, автограббер, что делать?

untee · 2026-07-01T11:06:51.0000000Z

Обнаружил полную копию сайта на другом домене. Публикации на этом сайте появляются автоматически, сразу же после их появления у меня. Есть несколько интересных нюансов: - графика не импортируется на чужой хост. Ссылки на всю графику всегда с сайта-оригинала. - сайт-копия получает трафик, причем не связанный с моим контентом и моим трафиком, хотя тематика общая. Это видно по метрике, код которой тоже остается на сайте-копии. - нагуглил целую сеть таких сайтов http://domainbigdata.com/email/e5y78hurdvcbyr537hjkps@mail.ru Все они сделаны по одной формуле, описанной выше. Оригинальный сайт можно узнать по урлу с любой картинки в любом посте. Главный вопрос: как от этого защитится? Или хотя бы усложнить жизнь тому, кто создает такие копии? Я пробовал блокировать IP хоста в htaccess, но результата не дало. Буду благодарен за советы.

727

MoMM

9 ноября 2015, 16:25

#41

umercomp:
Вы всерьез полагаете, что зная имя файла подтверждения можно подтвердить права на сайт с ДРУГОГО домена?

а вы попробуйте, не знаю как "вот прямо сейчас", а раньше эта тема работала если грабер грабит по запросу пользователя, а не заранее парсится

U

28

umercomp

9 ноября 2015, 16:37

#42

MoMM, А, это я уже тут запутался, кто чей домен подтверждать собирается)).

На самом деле, такое может сработать, но только при беспросветной глупости владельца клона.

1

1609

SeVlad

9 ноября 2015, 16:48

#43

umercomp:
Вы всерьез полагаете, что, зная имя файла подтверждения, можно подтвердить права на сайт с ДРУГОГО домена?

Это, как показал KM.UA, такое действительно возможно.

Но какой дурак не будет отфильтровать не нужное.. вернее отдавать только нужное - для меня лёгкий шок, что такие имеются. А ведь они ж ещё должны как-то монетизировать эти клоны.

А вот насчёт скачать хтацесс.. По ГЕТ его не получишь.

Кто-то сможет объяснить как это возможно?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.

На сайте партнера наши Восстановление сайта после удаления Логика определения несуществующей страницы

239

KrutE

9 ноября 2015, 17:19

#44

если .htaccess не сработает, можно ловить HTTP_HOST в движке/HTML , и если отдает вражеский ресурс, делать редирект на себя

итогом будет склейка клона на ваш сайт.

но лучше метода чем предложили выше, наверное не существует)

1

Домен - проблема или Структура сайта 2 домена на 1

L

351

Ladycharm

9 ноября 2015, 18:21

#45

KrutE:
если .htaccess не сработает, можно ловить HTTP_HOST в движке/HTML , и если отдает вражеский ресурс, делать редирект на себя
итогом будет склейка клона на ваш сайт.

Да, редирект через <meta refresh - поклеит. Но HTTP_HOST - это переменная сервера, на вашем сервере она всегда будет = "ваш домен", а от вражеского сервера - она вам недоступна. Но можно отлавливать запросы автограббера по tuj IP и отдавать "нужный" html.

Можно сделать редирект на яваскрипте(им доменное имя легко проверяется) - склейка не гарантирована, но трафик удастся забрать к себе. А яваскрипты искать вырезать из html-кода - замаешься отделять зёрна от плевел.

Метод загрузки своего .haccess на вражеский сервер в 99% случаев не сработает.

Если закомментировать в конфиге Апача httpd.conf строки:

<Files ~ "^\.ht">
    Order allow,deny
    Deny from all
    Satisfy All
</Files>

то содержимое вашего файла .htaccess будет отдаваться в браузер при обращении по http://site.ru/.htaccess, так же как сейчас показывается содержимое robots.txt

Автограббер спокойно загрузит его к себе, как и любую другую страницу. Проблема в том, что автограббер или работает без кэширования, или хранит свой кэш в отдельной папке. То есть наш .htaccess не попадёт в корневую папку и вражеский веб-сервер его исполнять не будет. Плюс, файлы кэша обычно имеют другие имена.

Но не .htacces единым ... Вектор "куда копать" в топике задан правильный, кому надо теперь сообразит, что ещё можно сделать.

1

Как лучше сделать короткие Кэш и сжатие для Проблема с htaccess

Z0

842

ziliboba0213

10 ноября 2015, 03:20

#46

korchik:
Скорей всего на сервере стоит скрипт, который парсит сайт и заменяет внутренние ссылки на свои. И происходит это в момент обращения страницы на клоне сайта. При этом, не всегда айпишник сайта совпадает с айпи парсера.

Но есть выход ☝
Ищем какую-нибудь не популярную страничку на своём сайте, меняем своё имя домена на имя домена клона и загружаем в браузере пару раз, при этом запоминаем время обращения к данной странице (для упрощения поиска в логе).
Например, http://site-klon.com/cat/3647463.html

Сразу же окрываем лог апача access.log и ищем поиском фразу "3647463.html"

Будет что-то вроде этого:
109.187.17.21 - - [03/Nov/2015:12:04:31 +0200] "GET /cat/3647463.html

Это и есть айпи парсера. После чего блокируем этот айпишник в .htaccess:

Order Allow,Deny
Allow from All
Deny from 109.187.17.21

Или же можно редиректнуть негодяя-клона на какой-нибудь xxx сайт:
RewriteEngine on
RewriteCond %{REMOTE_ADDR} (109.187.17.21)
RewriteRule .* http://www.плохойсайт.ру/ [R=301,L]

В логах только мой заход показан... 🤪

И все остальные способы тоже не помогли. Скрипты он вырезает. $_SERVER отдает мой сайт. Борюсь с этой какой: http://meyh***enmgh.com

86

Die-Hard

10 ноября 2015, 06:47

#47

Так это "черный дракон" работает. Этот скрипт копирования сайтов "один в один" даже здесь в "инфопродуктах" продавался. Для массовых созданий сайтов под Сапу, либо для продвижения своих проектов - так что пристально за каждым клоном там никто особо не следит.

Следую своим курсом

Новый курс: Большие деньги Сайты-двойники. Как бороться и Необычное продвижение...

1609

SeVlad

10 ноября 2015, 10:16

#48

Ladycharm:
Автограббер спокойно загрузит его к себе, как и любую другую страницу. Проблема в том, что автограббер или работает без кэширования, или хранит свой кэш в отдельной папке. То есть наш .htaccess не попадёт в корневую папку и вражеский веб-сервер его исполнять не будет. Плюс, файлы кэша обычно имеют другие имена.

Не пояснишь почему site.com/google-file.txt роботы съедят из корня, а site.com/.htaccess в таком же механизме окажется не в корне и ещё переименованный?

KU

251

Vitalii Polishchuk

10 ноября 2015, 17:05

#49

SeVlad:
Не пояснишь почему site.com/google-file.txt роботы съедят из корня, а site.com/.htaccess в таком же механизме окажется не в корне и ещё переименованный?

Граббер делает такие же урлы за счет mod_rewrite.

.htaccess он может загрузить, и он даже будет доступен по ссылке сайт-клон/.htaccess

Но реально он будет лежать в другой директории. Иначе можно было бы скормить ему php код, и таким образом залить шелл.

2

Хостинг ( https://good-host.net ) / Linux VPS ( https://good-host.net/vps ) / Windows VPS ( https://good-host.net/windows-vps ) / Выделенные серверы ( https://good-host.net/dedicated ) 14 лет онлайн!

Все о сателлитах. Семинар ЧПУ для свойств товара Переезд сайта на новый

DV

644

DenisVS

10 ноября 2015, 17:20

#50

Теперь я в непонятках. Как вообще можно загрузить с веб сервера .htaccess, если это

а) файл конфигурации директории сервера

б) невидимый?

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )

Курс биткоина превысил $50 тысяч

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Полная копия сайта, автограббер, что делать?