Как на сервере можно проверить с браузера зашли или с php скрипта?

12
lutskboy
На сайте с 22.11.2013
Offline
173
404

Привет

Есть обычный скрипт php. curl чтоб спарсить хтмл код страници. Но, если зашел с браузера, то код отдают нормальный.

А если с  php скрипта, то подсовывают разные пакости. То постер не тот, то заголовок.

Как они это проверяют? Я и с режима инкогнито зашел. Чтоб куки не было и сессий. И в скрипт все заголовки вставил один в один.

И ip адрес тот же, и все равно чего то не хватает. Даже сертификат подсунул. Не идет и все.

Сайт порнхаб

LEOnidUKG
На сайте с 25.11.2006
Offline
1730
#1
Версия протокола HTTPS одинаковая?
✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/
-S
На сайте с 10.12.2006
Offline
1356
#2
lutskboy :

Есть обычный скрипт php. curl чтоб спарсить хтмл код страници. Но, если зашел с браузера, то код отдают нормальный.

А если с  php скрипта, то подсовывают разные пакости. То постер не тот, то заголовок.

Как они это проверяют?

Требуется эмуляция браузера, curl не эмулирует ничего, он напрямую дергает, а юзеры заходят через браузер.

https://github.com/chrome-php/chrome

GitHub - chrome-php/chrome: Instrument headless chrome/chromium instances from PHP
GitHub - chrome-php/chrome: Instrument headless chrome/chromium instances from PHP
  • chrome-php
  • github.com
This library lets you start playing with chrome/chromium in headless mode from PHP. Can be used synchronously and asynchronously! Features Open chrome or chromium browser from php Create pages and navigate to pages Take screenshots Evaluate javascript on the page Make PDF Emulate mouse Emulate keyboard Always IDE friendly Happy browsing...
lutskboy
На сайте с 22.11.2013
Offline
173
#3
LEOnidUKG #:
Версия протокола HTTPS одинаковая?

а как это проверить?

-S
На сайте с 10.12.2006
Offline
1356
#4
lutskboy #:

а как это проверить?

Зачем вам все это? Парсить хотите?

lutskboy
На сайте с 22.11.2013
Offline
173
#5
-= Serafim =- #:
Требуется эмуляция браузера

Но по сути одно и то. Заголовки передали. Че еще нужно? А чего то не хватает. Что конкретно? Не думаю что нужно целую библиотеку ради этого подключать.

lutskboy
На сайте с 22.11.2013
Offline
173
#6
-= Serafim =- #:

Зачем вам все это? Парсить хотите?

да. постер, название..

видео питон скачивает

AB
На сайте с 27.01.2016
Offline
93
#7
lutskboy :

Привет

Есть обычный скрипт php. curl чтоб спарсить хтмл код страници. Но, если зашел с браузера, то код отдают нормальный.

А если с  php скрипта, то подсовывают разные пакости. То постер не тот, то заголовок.

Как они это проверяют? Я и с режима инкогнито зашел. Чтоб куки не было и сессий. И в скрипт все заголовки вставил один в один.

И ip адрес тот же, и все равно чего то не хватает. Даже сертификат подсунул. Не идет и все.

Сайт порнхаб

Как правило проверка простая - проверяется возможность выполнения js кода. Естественно запрос curl'ом никакой js код выполнить не сможет. 

Решение - использование браузера в headless режиме. 

AB
На сайте с 27.01.2016
Offline
93
#8
lutskboy #:

да. постер, название..

видео питон скачивает

Тем более если уже есть питон - используйте selenium webdriver, чтобы забрать необходимые данные. 

lutskboy
На сайте с 22.11.2013
Offline
173
#9
Alex_Black48 #:
проверяется возможность выполнения js кода

какой js код? речь идет именно о первом запросе. и мне нужно хтмл код ее. тут  js никакого нет. открываю сам браузер как просмотр исходного кода. никакие  js при этом не используются

lutskboy
На сайте с 22.11.2013
Offline
173
#10
Alex_Black48 #:
Тем более если уже есть питон - используйте selenium webdriver

временно так и сделал. но php был в разы быстрее. ничего лишнего 

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий