Полная копия сайта, автограббер, что делать?

MoMM
На сайте с 16.06.2006
Offline
727
#41
umercomp:
Вы всерьез полагаете, что зная имя файла подтверждения можно подтвердить права на сайт с ДРУГОГО домена?

а вы попробуйте, не знаю как "вот прямо сейчас", а раньше эта тема работала если грабер грабит по запросу пользователя, а не заранее парсится

U
На сайте с 09.04.2015
Offline
28
#42

MoMM, А, это я уже тут запутался, кто чей домен подтверждать собирается)).

На самом деле, такое может сработать, но только при беспросветной глупости владельца клона.

SeVlad
На сайте с 03.11.2008
Offline
1609
#43
umercomp:
Вы всерьез полагаете, что, зная имя файла подтверждения, можно подтвердить права на сайт с ДРУГОГО домена?

Это, как показал KM.UA, такое действительно возможно.

Но какой дурак не будет отфильтровать не нужное.. вернее отдавать только нужное - для меня лёгкий шок, что такие имеются. А ведь они ж ещё должны как-то монетизировать эти клоны.

А вот насчёт скачать хтацесс.. По ГЕТ его не получишь.

Кто-то сможет объяснить как это возможно?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
KrutE
На сайте с 29.04.2006
Offline
239
#44

если .htaccess не сработает, можно ловить HTTP_HOST в движке/HTML , и если отдает вражеский ресурс, делать редирект на себя

итогом будет склейка клона на ваш сайт.

но лучше метода чем предложили выше, наверное не существует)

L
На сайте с 07.12.2007
Offline
351
#45
KrutE:
если .htaccess не сработает, можно ловить HTTP_HOST в движке/HTML , и если отдает вражеский ресурс, делать редирект на себя
итогом будет склейка клона на ваш сайт.

Да, редирект через <meta refresh - поклеит. Но HTTP_HOST - это переменная сервера, на вашем сервере она всегда будет = "ваш домен", а от вражеского сервера - она вам недоступна. Но можно отлавливать запросы автограббера по tuj IP и отдавать "нужный" html.

Можно сделать редирект на яваскрипте(им доменное имя легко проверяется) - склейка не гарантирована, но трафик удастся забрать к себе. А яваскрипты искать вырезать из html-кода - замаешься отделять зёрна от плевел.

Метод загрузки своего .haccess на вражеский сервер в 99% случаев не сработает.

Если закомментировать в конфиге Апача httpd.conf строки:

<Files ~ "^\.ht">
Order allow,deny
Deny from all
Satisfy All
</Files>
то содержимое вашего файла .htaccess будет отдаваться в браузер при обращении по http://site.ru/.htaccess, так же как сейчас показывается содержимое robots.txt

Автограббер спокойно загрузит его к себе, как и любую другую страницу. Проблема в том, что автограббер или работает без кэширования, или хранит свой кэш в отдельной папке. То есть наш .htaccess не попадёт в корневую папку и вражеский веб-сервер его исполнять не будет. Плюс, файлы кэша обычно имеют другие имена.

Но не .htacces единым ... Вектор "куда копать" в топике задан правильный, кому надо теперь сообразит, что ещё можно сделать.

Z0
На сайте с 03.09.2009
Offline
831
#46
korchik:
Скорей всего на сервере стоит скрипт, который парсит сайт и заменяет внутренние ссылки на свои. И происходит это в момент обращения страницы на клоне сайта. При этом, не всегда айпишник сайта совпадает с айпи парсера.

Но есть выход ☝
Ищем какую-нибудь не популярную страничку на своём сайте, меняем своё имя домена на имя домена клона и загружаем в браузере пару раз, при этом запоминаем время обращения к данной странице (для упрощения поиска в логе).
Например, http://site-klon.com/cat/3647463.html

Сразу же окрываем лог апача access.log и ищем поиском фразу "3647463.html"

Будет что-то вроде этого:
109.187.17.21 - - [03/Nov/2015:12:04:31 +0200] "GET /cat/3647463.html

Это и есть айпи парсера. После чего блокируем этот айпишник в .htaccess:

Order Allow,Deny
Allow from All
Deny from 109.187.17.21

Или же можно редиректнуть негодяя-клона на какой-нибудь xxx сайт:
RewriteEngine on
RewriteCond %{REMOTE_ADDR} (109.187.17.21)
RewriteRule .* http://www.плохойсайт.ру/ [R=301,L]

В логах только мой заход показан... 🤪

И все остальные способы тоже не помогли. Скрипты он вырезает. $_SERVER отдает мой сайт. Борюсь с этой какой: http://meyh***enmgh.com

Die-Hard
На сайте с 08.11.2010
Offline
86
#47

Так это "черный дракон" работает. Этот скрипт копирования сайтов "один в один" даже здесь в "инфопродуктах" продавался. Для массовых созданий сайтов под Сапу, либо для продвижения своих проектов - так что пристально за каждым клоном там никто особо не следит.

Следую своим курсом
SeVlad
На сайте с 03.11.2008
Offline
1609
#48
Ladycharm:
Автограббер спокойно загрузит его к себе, как и любую другую страницу. Проблема в том, что автограббер или работает без кэширования, или хранит свой кэш в отдельной папке. То есть наш .htaccess не попадёт в корневую папку и вражеский веб-сервер его исполнять не будет. Плюс, файлы кэша обычно имеют другие имена.

Не пояснишь почему site.com/google-file.txt роботы съедят из корня, а site.com/.htaccess в таком же механизме окажется не в корне и ещё переименованный?

KU
На сайте с 17.07.2008
Offline
251
#49
SeVlad:
Не пояснишь почему site.com/google-file.txt роботы съедят из корня, а site.com/.htaccess в таком же механизме окажется не в корне и ещё переименованный?

Граббер делает такие же урлы за счет mod_rewrite.

.htaccess он может загрузить, и он даже будет доступен по ссылке сайт-клон/.htaccess

Но реально он будет лежать в другой директории. Иначе можно было бы скормить ему php код, и таким образом залить шелл.

Хостинг ( https://good-host.net ) / Linux VPS ( https://good-host.net/vps ) / Windows VPS ( https://good-host.net/windows-vps ) / Выделенные серверы ( https://good-host.net/dedicated ) 14 лет онлайн!
DV
На сайте с 01.05.2010
Offline
644
#50

Теперь я в непонятках. Как вообще можно загрузить с веб сервера .htaccess, если это

а) файл конфигурации директории сервера

б) невидимый?

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий