- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Пытаюсь парсить выдачу гугла, но он выдает разные страницы для браузера и скрипта. Разница небольшая: в выдаче для браузера присутствует такой код для каждого сайта в списке:
<p class=g><a href="http://www.brandmedia.ru/serv__idP_54.html" onmousedown="return clk(this.href,'res','2','')"><b>Дизайн</b> | Web-<b>дизайн</b> | Рекламный <b>Дизайн</b> | Полиграфия | Фирменный <b>...</b></a><br><font size=-1><b>Дизайн</b>, Web-<b>дизайн</b>, Рекламный <b>Дизайн</b>, Полиграфия, Фирменный стиль, логотипы,<br>
А для скрипта все тоже самое только нет:
onmousedown="return clk(this.href,'res','2','')"
А мне эта строчка нужна для определения позиции сайта, в данном случае, сайт на второй позиции.
Для парсинга использую функцию пхп:
$t=file_get_contents('http://www.google.ru/search?hl=ru&q='.urlencode($keyword).'&lr=lang_ru');
В чем здесь проблема?
попробуйте открывать CURL'ом, отдавая User-Agent какого-нибудь браузера
А использование сокетов здесь никак помочь не может? Потому что CURL к сожалению нет на сервере, в котором будет использоваться скрипт, поэтому нужно попробовать обойтись стандартным набором функций
Можно через сокеты делать, но тогда надо все http-заголовки вручную формировать.
Проще найти хостинг с поддержкой curl.
проблема ушла. Нужно было отредактировать php.ini, изменив user-agent
Регекспы рулят и все такое.
Пытаюсь парсить выдачу гугла, но он выдает разные страницы для браузера и скрипта. Разница небольшая: в выдаче для браузера присутствует такой код для каждого сайта в списке:
Парсером не поделишся? Хочу где то найти такой и нигде не нахожу.
И не найдешь. Иди к знакомому прогеру и заказывай :)
Ничего сложного, я когда-то одному челу сделал парсинг рамблера и яндекса с возможностью выбора поисковика !
Обращайтесь ;) Хотя для Гугля, хоть для Яхи с МСНом
не проще юзать Google API?