- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вобщем со вчерашнего дня один мой сайт вырубился, смотрю по графику в админке хостинга, что я привысил допустимый лимит нагрузки на базу данных. Причём до этого нагрузка была 0 :idea:
Сайт большой на двиге дле, после проанализировав логи, стало ясно что новости тупо грабят:no:
каким то граббером. Так как по логам видно что один IP бегает по страницам. Поглядев в яндексе инфу об этом IP нашёл КОПИЮ ситуацию как и у меня с этим же IP:D
Забанил ip в админке и всё, нагрузка опять 0 )
Вобщем то вопрос в том, если он сменит IP как можно предостеречья от его грабера ?:confused:
alex_778 добавил 19.02.2009 в 00:23
Всё пипец, он чё то придумал и теперь бан ip не спас (
ЧТО ДЕЛАТЬ народ ? выручит пожалуйста, я заплачу$
alex_778 добавил 19.02.2009 в 00:50
я отключил сайт, но он всё равно парсит парсит страницы...в логах написано
как не понятно
Можно попоробовать использовать страницы-ловушки - такие на которые человек никак не зайдет, а грабер поведется. Например, делать ссылку в виде прозрачной точки 1х1 пиксель или в невидимом div'е.
На этой странице-ловушке анализировать запрос и если это не известный порядочный бот типа гугликовского, то банить ip.
Ну или таки внимательно анализировать логи - в них таки все зафиксированно...
А юзер-агент какой? Хуизы? Какие он использует айпишники? Быть может, будет достаточно занести в бан подсети некоторых хостеров?
Я как раз готовлю сайт, который содержит в себе все подсети, с которых ничего хорошего не придет ;)
граббер ищет контент по шаблону, так возьмите рандоминизируйте шаблон фулл новости
vandamme добавил 19.02.2009 в 14:13
Я сам граблю подобные ДЛЕ сайты
а свой защищаю от граббинга, интересно если не секрет каков адрес вашего сайта? Может я его гружу? :)
можно в личку
ссылку не дам )
какую тематику вы грабите ?
Народ, расскажите побольше про способы самообороны от грабинга?
Вабще былобы круто сделать Одну большую статью про то как защищаться от этих роботов, и прилепить её гденить на виду и добавлять в неё новые методы, и новые грабилки...
логи анализируйте регулярно. баньте превентивно сети датацентров.
простых способов нет. грабберы прекрасно изображают обычных посетителей.
вобщем забанил я того грабилу по ip в админке и через .htaccess :)
щас всё нормально. Но щас буду чаще смотреть на статитику нагрузки на базу !
да, кстати. граббилки всегда мимо кеша идут, не так как пользователи. Поэтому запросы от граббилок обычно тормознее остальных.
Список мер, которые можно принять не очень большрой
Я обычно делаю следующее
ставлю на странице скрытые, труднонажимаемые(img 1x1 px) ссылки на специальные страницы
на этих страницах
*для основных(нужных мне) поисковиков ссылки и не генерирую
если ajax не работает и есть подозренеие на принадлежность ip cерверу - бан
если перешли по скрытым ссылкам "в глубь" более 2 раз - бан
если за короткое время загружается много страниц - редирект на страницу с проверкой на бота
если есть свободные ресурсы, то генерю для таких ботов очень занятный текст на страницах.