Ladycharm

Рейтинг
351
Регистрация
07.12.2007
KrutE:
если .htaccess не сработает, можно ловить HTTP_HOST в движке/HTML , и если отдает вражеский ресурс, делать редирект на себя
итогом будет склейка клона на ваш сайт.

Да, редирект через <meta refresh - поклеит. Но HTTP_HOST - это переменная сервера, на вашем сервере она всегда будет = "ваш домен", а от вражеского сервера - она вам недоступна. Но можно отлавливать запросы автограббера по tuj IP и отдавать "нужный" html.

Можно сделать редирект на яваскрипте(им доменное имя легко проверяется) - склейка не гарантирована, но трафик удастся забрать к себе. А яваскрипты искать вырезать из html-кода - замаешься отделять зёрна от плевел.

Метод загрузки своего .haccess на вражеский сервер в 99% случаев не сработает.

Если закомментировать в конфиге Апача httpd.conf строки:

<Files ~ "^\.ht">
Order allow,deny
Deny from all
Satisfy All
</Files>
то содержимое вашего файла .htaccess будет отдаваться в браузер при обращении по http://site.ru/.htaccess, так же как сейчас показывается содержимое robots.txt

Автограббер спокойно загрузит его к себе, как и любую другую страницу. Проблема в том, что автограббер или работает без кэширования, или хранит свой кэш в отдельной папке. То есть наш .htaccess не попадёт в корневую папку и вражеский веб-сервер его исполнять не будет. Плюс, файлы кэша обычно имеют другие имена.

Но не .htacces единым ... Вектор "куда копать" в топике задан правильный, кому надо теперь сообразит, что ещё можно сделать.

ziliboba0213:
Альт у картинок это ладно, но титл к ним зачем?

Браузер Opera по наведению на картинку делает хинт из атрибута title=, а на alt= она кладёт с прибором.

PS: Когда у Рамблера был собственный поиск - он считал title= частью контента страницы и получалось неплохо спамить.

wa-lk:
Именно, ибо убирает блоки пользователь добровольно (установив адблок, согласившись на установку и пр..), а вот запрет прилетит без его ведома

В лицензии на использовании сайта прописываете запрет на редактирование блоков контента и дизайна. И что в противном случает сайт не будет нормально отображаться в браузере и вообще работать.

PS: Лицензии, конечно, никто не читает, но это пока в суде тебя носом в неё не ткнут.

Smart Shot:
А вообще я первый раз встречаю такой ответ.

Это достаточно популярный ответ Платонов. И по снипетам явно прослеживается за что наложены санкции.

Stas0nis:
Ladycharm, а что лично Вы посоветуете мне?

В свете недавних топиков Парковка Седо - прямой путь к АГС и Парковка Руцентра = АГС Яндекса, меня больше всего беспокоят эти ваши слова:

Поставил тематическую текстовую заглушку на провисевший 2 года домен на парковке.

Надо бы как-то проверить домен на "старый" АГС - сделать несколько html-страниц и посмотреть, что Яндекс будет нормально индексировать.

А SSL поставите когда займётесь сайтом на этом домене. Сейчас менять тариф на хостинге и тратить время на SSL сакрального смысла не вижу. Тем более, в будущем вы можете и передумать делать сайт на этом домене.

SeVlad:
Сообщение от bruder
50 мегов на хостинге
Откуда ты это взял?

bruder - он очень толковый и сообразительный. Плюс, он пост топикстартера прочитал внимательно:

Хотел установить SSL, но Цисхост вроде не поддерживает на этом тарифе

Справка: Самый дешёвый тариф CIShost - Микро: 10 руб/мес, 50 Mb, SSL не поддерживается. А на остальных тарифах SSL уже поддерживается.

SeVlad:
Я уже даже опускаю, что в изначальной ситуации камрад не имеет базовых знаний сисадмина (логи и тп не смотрелись) и пр:
. . .
Весь вопрос сводиться к: Как можно отдать гуглу файл чужого домена, если на него нет (никто не делал) ссылок? Т.е. этот файл граббер не увидит и файл на домен парсера не попадёт.

У этих "комрадов" такая сообразительность и природная смекалка, что сисадмины с их "базовыми знаниями" нервно курят в сторонке.

Вон, superf сразу сказал что надо сделать, и никакие логи ему не потребовались.

В топике ещё на первой странице чётко объяснили как работает этот вариант автограббера.

Пост untee:

Публикации на этом сайте появляются автоматически, сразу же после их появления у меня

Явно же не в онлайн режиме автограббер сканирует сайт-жертву.

Пост korchik:

И происходит это в момент обращения страницы на клоне сайта
. . .
Ищем какую-нибудь не популярную страничку на своём сайте, меняем своё имя домена на имя домена клона и загружаем в браузере пару раз, при этом запоминаем время обращения к данной странице (для упрощения поиска в логе).

и подробно расписал нюансы работы и что смотреть в логах сервера. Сразу видно, что человек про граббинг знает не по наслышке.

SeVlad:
Я попробую для блондиноГ-пенсов с амбициями объяснить поподробней и попонятней: граббер может получить только те страницы, на которые есть ссылки. Нет ссылки на "секретный" файл - никто посторонний из вне о нём не узнает.

Для бронетанкистов: автограбберы сдёргивают с сайта-жертвы те страницы, к которым было обращение на домен автограббера по http. Практически, это кэширующий прокси для одного домена.

SeVlad:
И чё? Блондинкам никак не понять, что этот файл граббер никак не захватит и соответственно он не попадёт на домен. Если его конечно не скормить специально, но этого никто не делал.

Не, это пенсионерам никак не понять, что автограббер не имеет у себя на сервере полной копии донора-жертвы.

В момент обращения к url, которого нет в кэшэ автограббера, он запрашивает его с донора-жертвы, заменяет внутренние ссылки на свой домен, и складывает страницу к себе в кэш. Потом уже страницы этим url автограббер сможет отдавать из своего кэша.

Вот так работают автограбберы :), они не сканируют сайт-жертву, это накладно по ресурсам.

Они сдергивают с жертвы только те url, которые посещаются живыми посетителями или роботами-индексаторами ПС на автограбберовской копии сайта.

SeVlad:
Не имеет, но дёргает.. :)
Счастьелабортатка, расскажи откуда твой автограббер узнает урл файла, сгенерённого GWT?

Когда ты нажмёшь на кнопку "подтвердить права на сайт"(автограбберовского домена, который был занёсён в твою панель GWT), Google запросит с домена автограббера этот "урл файла".

Добавь домен yandex.ru в свою панель GWT и нажми кнопку "подтвердить права". Потом напиши Платонам чтобы глянули логи - они подтвердят, что Google запросил твой "секретный url" с домена Яндекса :) Но на домене yandex.ru не установлен автограббер поэтому Яндекс не сможет отдать этот файл с корректным содержимым, и отдаст 404

PS: Для тех, кто в танке, принцип подтверждения домена был детально разжёван выше.

Всего: 4257