- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Граббер делает такие же урлы за счет mod_rewrite.
.htaccess он может загрузить, и он даже будет доступен по ссылке сайт-клон/.htaccess
Но реально он будет лежать в другой директории.
Ок. Понятно, спс.
Иначе можно было бы скормить ему php код, и таким образом залить шелл.
Так что мешает такому граберру скормить шелл? Я об этом, кстати, сразу подумал как только про роботс понял.
Тем более если вместе с хтацессом.
Теперь я в непонятках. Как вообще можно загрузить с веб сервера .htaccess,
В конфиге сервере разрешить доступ к нему из веба.
В конфиге сервере разрешить доступ к нему из веба.
Зачем ? :)
Так что мешает такому граберру скормить шелл?
Граббер слопает шелл, но чтобы запустить его уже потребуются знания сисадмина и "немного удачи":
1. надо чтобы граббер сохранял полученное в кэш на диск. Он скорее всего кэширует ненадолго, иначе он задёргает сайт-жертву запросами, будет быстро обнаружен и забанен по IP.
2. узнать путь к папке с кэшем.
3. узнать имя сохранённого фала, простые грабберы делают имя файла из url страницы(убирая недопустимые символы) - так его легче искать в кэше и не надо хранить таблицу соответствий url <-> имя_файла_с_кэшем.
4. в папке с кэшем не должно быть отключено исполнение скриптов.
Простым вебмастерам куда проще вставлять в страницы яваскрипт с редиректом на себя или пробовать подтвердить права на сайт.
Только после этого топика в автограбберах эти возможности быстро пофиксят.
---------- Добавлено 10.11.2015 в 19:40 ----------
Зачем ? :)
Только скорее всего копия .htaccess будет лежать не в корневой папке и под другим именем, поэтому вражеский веб-сервер она не подействует.
Ladycharm, ага, я потерял мысль. Вы тут о подсовывании файла врагу.
Соглашусь с тем, что граббинг этого файла в нужном представлении маловероятен.
но чтобы запустить его уже потребуются знания сисадмина и "немного удачи":
Из "знаний сисадмина" достаточно уметь читать свои логи, а так нужно чуть-чуть знать пхп (например генерить файлы). пп1-3 проблем не представляют, если 4й выполняется. Вот это уже согласен, нужна "удача".
Думается мне приблиз. такая же, как и найти "вебмастера" с граббером, которым можно скормить свой и роботс, файл подтверждения и перетянуть на себя его домен.
Ответьте на мой вопрос пожалуйста кто-нибудь: /ru/forum/comment/14113608
Просто там как я понял какой-то странный граббер, он урлы в свои переделывает (шифрует типа). Я создал тестовую страничку, поставил на нее ссылку, зашел на нее с сайта-граббера. Посмотрел логи - захода нет (есть только мой, когда я зашел на нее сам (для проверки)). Я что-то совсем запутался...
ziliboba0213, надо смотреть.
Ответьте на мой вопрос пожалуйста кто-нибудь:
Без показа url сайта автограббера конкретики не будет, а догадок вам уже накидали достаточно, чтобы докопаться самому.
Вот, скажите, как автограббер смог показать вам копию вашей НОВОЙ страницы, не запросив её с вашего сервера? В логах должны быть следы.
Без показа url сайта автограббера конкретики не будет, а догадок вам уже накидали достаточно, чтобы докопаться самому.
Вот, скажите, как автограббер смог показать вам копию вашей НОВОЙ страницы, не запросив её с вашего сервера? В логах должны быть следы.
Все догадки проверил. Сайт вот же, я показывал - meyhenmgh.com - это получается какой-то прокси, но зачем он сохраняет посещенные страницы у себя - непонятно.
Наверное просто кто-то поделился ссылкой на проксю, она и проиндексировалась... Хотя не уверен.
Все догадки проверил. Сайт вот же, я показывал - meyhenmgh.com - это получается какой-то прокси, но зачем он сохраняет посещенные страницы у себя - непонятно.
Да, это просто публичный прокси. Страницы сохраняет в кэше, чтобы не дергать постоянно исходные сайты.
Яндекс и Google его индексируют, но интересно, что в кэше Google при этом - исходный сайт, с которого взята страница (Это версия страницы http://medelite.ru/hepatology/principles.php из кеша Google)
У меня в логах светятся его IP 74.6.53.178, 74.6.53.179, 74.6.53.180, возможно, есть и другие.
PS: Прокси - тупой, он не проверяет на "свой домен", поэтому ему можно скормить его же собственные страницы. И он начинает проксировать самого себя (показывать только то, что у него было сохранено в кэше, ибо исходного сайта он уже не знает)
Если несколько раз рекурсивно запустить это на повторную индексации в Google, скорее всего Google его выплюнет из выдачи.