Полная копия сайта, автограббер, что делать?

SeVlad
На сайте с 03.11.2008
Offline
1609
#51
KM.UA:
Граббер делает такие же урлы за счет mod_rewrite.
.htaccess он может загрузить, и он даже будет доступен по ссылке сайт-клон/.htaccess
Но реально он будет лежать в другой директории.

Ок. Понятно, спс.

KM.UA:
Иначе можно было бы скормить ему php код, и таким образом залить шелл.

Так что мешает такому граберру скормить шелл? Я об этом, кстати, сразу подумал как только про роботс понял.

Тем более если вместе с хтацессом.

DenisVS:
Теперь я в непонятках. Как вообще можно загрузить с веб сервера .htaccess,

В конфиге сервере разрешить доступ к нему из веба.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
DV
На сайте с 01.05.2010
Offline
644
#52
SeVlad:
В конфиге сервере разрешить доступ к нему из веба.

Зачем ? :)

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
L
На сайте с 07.12.2007
Offline
351
#53
SeVlad:
Так что мешает такому граберру скормить шелл?

Граббер слопает шелл, но чтобы запустить его уже потребуются знания сисадмина и "немного удачи":

1. надо чтобы граббер сохранял полученное в кэш на диск. Он скорее всего кэширует ненадолго, иначе он задёргает сайт-жертву запросами, будет быстро обнаружен и забанен по IP.

2. узнать путь к папке с кэшем.

3. узнать имя сохранённого фала, простые грабберы делают имя файла из url страницы(убирая недопустимые символы) - так его легче искать в кэше и не надо хранить таблицу соответствий url <-> имя_файла_с_кэшем.

4. в папке с кэшем не должно быть отключено исполнение скриптов.

Простым вебмастерам куда проще вставлять в страницы яваскрипт с редиректом на себя или пробовать подтвердить права на сайт.

Только после этого топика в автограбберах эти возможности быстро пофиксят.

---------- Добавлено 10.11.2015 в 19:40 ----------

DenisVS:
Зачем ? :)
Чтобы один раз набрать в браузере http://ДоменАвтограббера/.htaccess и автограббер скопировал ваш .htaccess на свой сервер.

Только скорее всего копия .htaccess будет лежать не в корневой папке и под другим именем, поэтому вражеский веб-сервер она не подействует.

DV
На сайте с 01.05.2010
Offline
644
#54

Ladycharm, ага, я потерял мысль. Вы тут о подсовывании файла врагу.

Соглашусь с тем, что граббинг этого файла в нужном представлении маловероятен.

SeVlad
На сайте с 03.11.2008
Offline
1609
#55
Ladycharm:
но чтобы запустить его уже потребуются знания сисадмина и "немного удачи":

Из "знаний сисадмина" достаточно уметь читать свои логи, а так нужно чуть-чуть знать пхп (например генерить файлы). пп1-3 проблем не представляют, если 4й выполняется. Вот это уже согласен, нужна "удача".

Думается мне приблиз. такая же, как и найти "вебмастера" с граббером, которым можно скормить свой и роботс, файл подтверждения и перетянуть на себя его домен.

Z0
На сайте с 03.09.2009
Offline
785
#56

Ответьте на мой вопрос пожалуйста кто-нибудь: /ru/forum/comment/14113608

Просто там как я понял какой-то странный граббер, он урлы в свои переделывает (шифрует типа). Я создал тестовую страничку, поставил на нее ссылку, зашел на нее с сайта-граббера. Посмотрел логи - захода нет (есть только мой, когда я зашел на нее сам (для проверки)). Я что-то совсем запутался...

U
На сайте с 09.04.2015
Offline
28
#57

ziliboba0213, надо смотреть.

L
На сайте с 07.12.2007
Offline
351
#58
ziliboba0213:
Ответьте на мой вопрос пожалуйста кто-нибудь:

Без показа url сайта автограббера конкретики не будет, а догадок вам уже накидали достаточно, чтобы докопаться самому.

Вот, скажите, как автограббер смог показать вам копию вашей НОВОЙ страницы, не запросив её с вашего сервера? В логах должны быть следы.

Z0
На сайте с 03.09.2009
Offline
785
#59
Ladycharm:
Без показа url сайта автограббера конкретики не будет, а догадок вам уже накидали достаточно, чтобы докопаться самому.

Вот, скажите, как автограббер смог показать вам копию вашей НОВОЙ страницы, не запросив её с вашего сервера? В логах должны быть следы.

Все догадки проверил. Сайт вот же, я показывал - meyhenmgh.com - это получается какой-то прокси, но зачем он сохраняет посещенные страницы у себя - непонятно.

Наверное просто кто-то поделился ссылкой на проксю, она и проиндексировалась... Хотя не уверен.

L
На сайте с 07.12.2007
Offline
351
#60
ziliboba0213:
Все догадки проверил. Сайт вот же, я показывал - meyhenmgh.com - это получается какой-то прокси, но зачем он сохраняет посещенные страницы у себя - непонятно.

Да, это просто публичный прокси. Страницы сохраняет в кэше, чтобы не дергать постоянно исходные сайты.

Яндекс и Google его индексируют, но интересно, что в кэше Google при этом - исходный сайт, с которого взята страница (Это версия страницы http://medelite.ru/hepatology/principles.php из кеша Google)

У меня в логах светятся его IP 74.6.53.178, 74.6.53.179, 74.6.53.180, возможно, есть и другие.

PS: Прокси - тупой, он не проверяет на "свой домен", поэтому ему можно скормить его же собственные страницы. И он начинает проксировать самого себя (показывать только то, что у него было сохранено в кэше, ибо исходного сайта он уже не знает)

Если несколько раз рекурсивно запустить это на повторную индексации в Google, скорее всего Google его выплюнет из выдачи.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий