- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Это скобка, а не смайлик как Вам кажется.
е-мае, сколько не закрытых скобок.
соррь
например тут есть скрипт который считает обращения с ip и при превышении лимита выдает капчу, есть список разрешенных и запрещенных ip. для храненния использует оперативку, хотя может быть и другое хранилище поддерживаемое классом System/SharedMemory
у поисковых ботов есть айпи...
О ВЕЛИКИЙ! дай список плиз!
Сам пишу парсеры, индивидуальные. Скажу со своей стороны, есть 2 варианта:
1. никак вы не защититесь.
2. защититесь, но тогда пострадают также ваши пользователи и поисковые боты.
2-й вариант на мой взгляд много хуже 1-го.
абсолютно защититься никак, но можно максимально усложнить процесс парсинга так, что не будет экономической выгоды парсить. Как вариант защиты придумалось ставить куку-ключ дающую право открыть следующую страницу (или несколько страниц, тк пользователь может открыть несколько страниц и из-за задержки соединения он могут придти не в том порядке в каком отправлялись) и при каждом запросе обновлять куку (кука привязана к ip и user-agent). это ограничит использование прокси в рамках одной сессии качания и подстановку разных user-agent. в результате получатся цепочки запросов. если цепочка слишком длиная (для каждого сайта индивидуально), то проверяем ее капчей.
- стартовать сессию со служебной инфой и дальше главной без сессии не пускать.
Вот к этому, дополнение: сессионную куку устанавливать не хеадерами с сервера, а джаваскриптом отгруженным в код страницы. Как писатель парсеров скажу, что если первое я легко обошел бы, то со втором уже не стал бы заморачиваться из уважения к владельцу сайта :)
P.S. А множественные обращения с одного IP по хорошему все равно надо блокировать, даже если не стоит задача защиты от парсера. Потому что сервер они грузят не по детски.
Вот к этому, дополнение: сессионную куку устанавливать не хеадерами с сервера, а джаваскриптом отгруженным в код страницы. Как писатель парсеров скажу, что если первое я легко обошел бы, то со втором уже не стал бы заморачиваться из уважения к владельцу сайта
И тем самым обломить все поисковых ботов, а так же тех юзеров кто отключил куки? Не слишком ли большая цена?
то со втором уже не стал бы заморачиваться из уважения к владельцу сайта
А как же спортивный интерес?
А как же спортивный интерес?
Насчёт спортивного интереса. Я слышал про метод защиты от него, правда для обычных программ. Даётся некое пояснение как обойти защиту, доступное только сильно продвинутому взломщику - таким образом для него это становится не интересным, а новичёк до этого пояснения и не доберётся.
Насчёт спортивного интереса. Я слышал про метод защиты от него, правда для обычных программ. Даётся некое пояснение как обойти защиту, доступное только сильно продвинутому взломщику - таким образом для него это становится не интересным, а новичёк до этого пояснения и не доберётся.
Ага, а ещё можно написать в комментариях: "Кто будет парсить - тот дурак"
Как написано на одном сайте: "Все права защищёны грубой физической силой!" :)