- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Господа, нужно спарсить пару каталогов лекарств с сайта eаптека, накидал быстро парсер через курл (заголовки меняю, куки сохраняю), но пока не смог вообще никакой ответа получить с этого сайта - пусто и все.
Подозреваю что там проверка на выполнение JS идет. Можете кто опытный в этом деле посмотреть?
Можно ли на php обойти эту проверку?
Господа, нужно спарсить пару каталогов лекарств с сайта eаптека, накидал быстро парсер через курл (заголовки меняю, куки сохраняю), но пока не смог вообще никакой ответа получить с этого сайта - пусто и все.
Подозреваю что там проверка на выполнение JS идет. Можете кто опытный в этом деле посмотреть?
Можно ли на php обойти эту проверку?
Копай в сторону phantomjs, под пыху есть либа https://jonnnnyw.github.io/php-phantomjs/
Господа, нужно спарсить пару каталогов лекарств с сайта eаптека, накидал быстро парсер через курл
Можно ли на php обойти эту проверку?
Вообще с этим сайтом проблем не было особых никогда. Там несколько редиректов на каждом добавляются куки прежде чем контент получишь. ...
Мы его(в том числе) каждый день парсим уже несколько лет....
И еще, уточни на каком оборудовании запускаешь парсинг - хостинк, сервер, прокси. Это все играет роль.
drDaemon, я застрял на первом же шаге только начав писать парсер. Создал функцию курла, функцию с разными юзер агентами бразузеров, чтобы при каждом запросе менять его.
Делаю запрос и пусто.... вот собственно и все. Прокси еще даже не покупал ибо и не успел логику парсера прописать.
Пропустил там строку
Надо проверить, выполняется ли автоматический редирект curl-ом
но если включен safe_mode то это не сработает.
Поэтому я проверил бы возвращаемый код (301, 302, 307) и если он есть, перезапросил страницу с куками, которые устанавливает текущий запрос.
Или посмотреть что передается в отладочном прокси (Fiddler например)
Если используешь свой ВПС или сервер, то самое простое установить докер, взять контейнер с HeadlessChrome, или еще проще с puppetteer, и через него получать отрендереный html
Upd:Я так понял ты пытаешься сделать AJAX запрос. Попробуй перед ним сделать обычный запрос и использовать его куки.
Все же, нужно использовать HeadlessCrome или Puppetteer. Чисто на PHP не получится с приемлемыми затратами сделать. Там добавлен js который делает разные проверки...