- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
По ссылке http://www.google.ru/search?q=запрос&hl=ru&lr=&newwindow=1&start=10&sa=N отдается бред..
Откуда нынче модно парсить? АПИ или есть другие варианты?
отдается бред..
в браузере открылось все нормально
да, оно открывается :) дело в том, что бредовыдачу отдает... А новая выдача (через морду гугла если искать) вся в js закрыта.
А новая выдача (через морду гугла если искать) вся в js закрыта.
Что-то я разницу не заметил, если сделать запрос с главной и перейти на вторую страниц и если пройти по вашей ссылке. Да и в коде разницы вроде нет :)
У меня гугл отдает урл поиска из браузера http://www.google.ru/#hl=ru&source=hp&q=запрос&aq=f&aqi=g10&aql=&oq=&gs_rfai=&fp=2853ca07a1321ea7
с другой страницей результатов поиска, непригодной для парсинга, а по старой ссылке совсем другие результаты, неверные мягко говоря.
DmitryShustov, а вы жс выключите в браузере)
bearman, ххы :) спасиб :)
итого: случилось самое худшее, эта гадина таки забанила ip мой.. пойду курить прокси
DmitryShustov, да не за что :)
DmitryShustov, совет на будущее - когда вы пишите паттерны для парсинга чего-то, составляйте их на основе исходника вытянутого тем же методом, который используется в вашей парселке/граббилки. В вашем случае это скорее-всего PHP с cURLом, вот просто курлом и вытягивайте, разумеется, в курле нужно разрешить 2-3 редиректа (гугле может редирекнуть на более подходящий для вашей локации домен).
Когда вы тяните браузером, а потом по этому исходнику пишите регу, в большенстве случаев рега будет неправильная, так как браузеры имеют такую привычку валидировать налету исходник, и показывает вам уже изменённый хтмл код )
и показывает вам уже изменённый хтмл код )
что это за браузер интересно? "просмотр исходного кода" вроде везде одинаково пашет - тупо взозвращает исходник
Опера сразу возвращает, а ff, к примеру, при просмотре исходного кода снова отправляет запрос (дура).