Сайт блокирует парсинг

ZD
На сайте с 20.04.2011
Offline
40
935

Пытаюсь спарсить информацию из каталога на сайте ajax скриптом.

Из за недавних ddos атак очевидно на сайте установили какую то защиту, из за которой после 10 страницы сайт выдает 500 ошибку при запросе с моего IP.

Пробовал увеличивать интервал между запросами, устанавливал рандомное значение интервала - не помогает.

Есть еще какие либо варианты обойти защиту?

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#1

Использовать прокси.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
ZD
На сайте с 20.04.2011
Offline
40
#2
LEOnidUKG:
Использовать прокси.

и какой смысл? во первых - скорость гораздо ниже, во вторых - нужно очень много проксей чтоб на каждые 10 товаров иметь ip

TF-Studio
На сайте с 17.08.2010
Offline
334
#3

Совсем большие задержки ставить.

Куки используются?

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
ZD
На сайте с 20.04.2011
Offline
40
#4
TF-Studio:
Совсем большие задержки ставить.
Куки используются?

Совсем большие это какие? Я ставил 7 - 12 секунд. Куки незнаю, но авторизации там нет. Как можно проверить используются ли куки?

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#5
ajax скриптом.

Это что такое?

TF-Studio
На сайте с 17.08.2010
Offline
334
#6
Как можно проверить используются ли куки?

Теперь все понятно...

Надеюсь Curl используется?

Заходим на морду, берем куку, идем парсить дальше - для начала так попробуйте

ZD
На сайте с 20.04.2011
Offline
40
#7
TF-Studio:
Теперь все понятно...

Надеюсь Curl используется?

Заходим на морду, берем куку, идем парсить дальше - для начала так попробуйте

Curl не используется. Где можно больше почитать по данной теме?

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#8
ZoidbergxD:
Curl не используется. Где можно больше почитать по данной теме?

Вы вообще на каком языке программируете парсер то?

Алеандр
На сайте с 08.12.2010
Offline
207
#9

Все зависит от того, что используется на сайте для такой защиты. Я лично такую делал, что спасти могли только наборы прокси, и никак иначе. Ни куки, ни тайм-ауты, ни подмены User-Agent, ничего бы не помогло.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий