Curl работает локально но не работает с сервера

239

Ragnarok

21 ноября 2018, 11:56

667

Приветствую!

Есть сайт, пробую сохранить страницу с помощью curl.

Открываю страницу в хроме, жму в консоли "Copy as cURL" как-то так

Получаю код

curl 'https://www.petsupplies.com/item/p/497203/' -H 'authority: www.petsupplies.com' -H 'pragma: no-cache' -H 'cache-control: no-cache' -H 'upgrade-insecure-requests: 1' -H 'user-agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36' -H 'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' -H 'accept-encoding: gzip, deflate, br' -H 'accept-language: en,ru;q=0.9,nl;q=0.8,ru-RU;q=0.7,en-US;q=0.6' --compressed

Вставляю в терминал на рабочем компьютере (Ubuntu, если это важно) -- страница сохраняется

Вставляю в терминал на сервере (CentOS) -- зависает с таймаутом.

Из-за чего такое может быть, как это обойти? Пробую wget и там такая же ерунда..

сайт https://www.petsupplies.com/item/p/497203/

//TODO: перестать откладывать на потом

S

469

Sitealert

21 ноября 2018, 12:13

#1

А не пробовали заголовки повыкидывать?

1

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.

239

Ragnarok

21 ноября 2018, 12:23

#2

Sitealert:
А не пробовали заголовки повыкидывать?

как только не пробовал) и curl и wget

если убирать заголовки, то и локально тоже зависает

S

469

Sitealert

21 ноября 2018, 12:35

#3

Ragnarok:
как только не пробовал) и curl и wget
если убирать заголовки, то и локально тоже зависает

Ну я имею в виду без фанатизма. Так, чтобы целевой сервер принял запрос, а запрашивающий - понял ответ. Вы же, судя по коду, не в файл сохраняете ответ, а в консоли прочитать пытаетесь.

1

239

Ragnarok

21 ноября 2018, 12:42

#4

Sitealert:
Ну я имею в виду без фанатизма. Так, чтобы целевой сервер принял запрос, а запрашивающий - понял ответ. Вы же, судя по коду, не в файл сохраняете ответ, а в консоли прочитать пытаетесь.

хочется хотя бы чего-то кроме таймаута..

уменьшил запрос до минимально работающего локально, сервер всё так же не хочет

curl 'https://www.petsupplies.com/item/p/497203/' -H 'user-agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36' -H 'accept-language: en;q=0.9,nl;q=0.8,en-US;q=0.6' --compressed

S

469

Sitealert

21 ноября 2018, 12:55

#5

Смотрите настройки севера. Может быть, исходящие запросы запрещены, может быть ещё какая хрень.

---------- Добавлено 21.11.2018 в 15:57 ----------

Сама команда работает, я проверил. Ответ, правда, довольно громоздкий. Двадцать тысяч строк html-кода, вес сохраненного файла 333КБ.

Спрашиваем и отвечаем по Как определить, в каком Большой размер html разметки

239

Ragnarok

21 ноября 2018, 13:18

#6

Sitealert, проверил на 3 разных серверах, на одном сработало, на двух других зависло с таймаутом.. не знаю куда ещё можно копать

S

469

Sitealert

21 ноября 2018, 13:22

#7

Ragnarok:
на одном сработало

Ну вот видите - от настроек сервера зависит (если, конечно, на принимающем сервере не включен какой-нибудь фильтр по IP - но это легко проверяется). Дальше лично я, к сожалению, ничего подсказать не могу. :o

1

как бороться с этим Что видет и что Аукцион. Сайт "Дом и

396

Оптимизайка

21 ноября 2018, 13:25

#8

Ragnarok, возможно на сайте, который вы пытаетесь открыть, стоит блокировка ip хостеров, иногда такое бывает для защиты от спамеров-парсеров. Попробуйте просто определить, доступен ли порт, телнетом: telnet www.petsupplies.com 443

1

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!

S

469

Sitealert

21 ноября 2018, 13:29

#9

Телнетом может не прокатить. Лучше как-то иначе. Самое простое - попробовать выкачать страницу другого сайта.

1

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Дзен реализовал для авторов возможность вывода денег через СПБ