CURL не парзит https сайт

123
vandamme
На сайте с 30.11.2008
Offline
675
#11
alexverem:
при этом некоторые Https страницы на др сайтах ок.

некоторые страницы могут требовать POST, если формы парсить.

CURLOPT_SSL_VERIFYHOST не обязательно, PEER достаточно.

---------- Добавлено 06.03.2020 в 20:17 ----------

tommy-gung:
-= Serafim =-, кто захочет, обойдет любую защиту

не, гоголь-капча никак не обходится.

всякие там токены crf - да.

SocFishing
На сайте с 26.09.2013
Offline
118
#12

vandamme, reCAPTCHA давно успешно распознается сервисами, но не об этом вопрос.

Если сайт не отдается с CURLOPT_SSL_VERIFYPEER, false то значит вас приблочили. Какой ответ, заголовок и содержимое. Включите CURLOPT_HEADER, true для возврата заголовка.

Думаю простая задача, что автор лезет на какой-ниб авито и залетает под блок. Ну или под cloudflare.

★Сервис идентифицирует (https://socfishing.com/?utm_source=searchengines) посетителей вашего сайта и предоставляет их профили ВКонтакте, Телефон, Почта! Цены копеечные, работаем 8 лет.
-S
На сайте с 10.12.2006
Offline
1354
#13
SocFishing:
vandamme, reCAPTCHA давно успешно распознается сервисами, но не об этом вопрос.

Ну просто block поставить и делов :D И новую гуглокапчу проходит софт?

A
На сайте с 12.10.2011
Offline
219
#14

ок спасибо посмотрю, мне вообще один раз в сутки инфу брать, не гружу сервер, а то тут люди беспокоятся )

-S
На сайте с 10.12.2006
Offline
1354
#15
alexverem:
ок спасибо посмотрю, мне вообще один раз в сутки инфу брать, не гружу сервер, а то тут люди беспокоятся )

Ну так бери информацию по api, если нечего беспокоиться :)

A
На сайте с 12.10.2011
Offline
219
#16
onep:
Да ладно ) А если так:

$url = '/;
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT,'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_HEADER, false);
$results = curl_exec ($ch);
curl_close($ch);

$doc = new DOMDocument();
@$doc->loadHTML($results);
$xpath = new DomXPath($doc);
$elements = $xpath->query('.//tr/td');
foreach ($elements as $i=>$element) {
echo $xpath->query($element->getNodePath().'/div')->item(0)->nodeValue.'<br />';
}

Не работает )

O
На сайте с 30.09.2019
Offline
18
#17
alexverem:
Не работает )

Даже в симуляторе работает http://phpfiddle.org/

SocFishing
На сайте с 26.09.2013
Offline
118
#18

onep, это ты верно подметил))))

vandamme
На сайте с 30.11.2008
Offline
675
#19

SocFishing, какими сервисами? в которых сидят люди и клацают?)

A
На сайте с 12.10.2011
Offline
219
#20
onep:
Даже в симуляторе работает http://phpfiddle.org/

Ну вот напр, вроде официально можно брать инфу о коронавирусе

http://github.com/CSSEGISandData/COVID-19/blob/master/csse_covid_19_data/csse_covid_19_daily_reports/03-08-2020.csv

У меня код ничего не выдает

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий