- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Друзья помогите с парсером пытаюсь вытягивать данные из поиска aliexpress делаю так:
код рабочий, но через 5-30 запросов получаю капчу, потом спустя некоторое время отпускает, как избежать капчу? без вариантов прокси, как получить выдачу прямо как пользователь, с своего компьютера таких проблем не обнаружил.
как избежать капчу?
Уже давно, практически все крупные сервисы используют защиту от парсинга с помощью яваскриптов.
Поэтому, единственный способ обойти ее - использовать браузеры.
zennoposter можно для подобных историй использовать, как раз что-бы а-ля в браузере открывалось и парсиролось
Я в таких случаях использую headless chrome и пакет puppeteer под nodejs. Есть реализация puppeteer на php, но мне оказалось проще работать с браузером на ноде, потому что под php всё это работает не очень хорошо.
я в этих инструментах не разбираюсь, можно примеры с кодом то что рекомендуете, мне для начало будет поизучать то что вы предлагаете.
код рабочий, но через 5-30 запросов получаю капчу, потом спустя некоторое время отпускает, как избежать капчу? без вариантов прокси, как получить выдачу прямо как пользователь, с своего компьютера таких проблем не обнаружил.
Очевидно что проблема в интервалах между запросами, попробуйте поиграться с этим. Если даёт сделать 5-30 запросов, потом капча, а потом отпускает, значит где-то превышаете лимит на число запросов с одного IP/cookie в интервал времени.
Нашел еще интересный способ парсит данные, оказывается aliexpress в теле html выдает выдачу результатов вот:
Только вот как идеально вырезать данные внутри переменной window.runParams чуваки помогите с регуляркой пожалуйста
как идеально вырезать данные внутри переменной window.runParams чуваки помогите с регуляркой пожалуйста
Там не нужна регулярка. Там нужна функция json_decode.
---------- Добавлено 13.09.2019 в 00:11 ----------
Там нужна функция json_decode.
Так сначала нужно получить этот json
---------- Добавлено 13.09.2019 в 00:11 ----------
Так сначала нужно получить этот json
Спасибо вырезает как автомат
zennoposter можно для подобных историй использовать, как раз что-бы а-ля в браузере открывалось и парсиролось
Или поробуйте browser automation studio, все просто настраивается