- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
И тот и другой, конечно же, не разрешают в прямую себя парсить (это, кажется, написано в их пользовательских соглашениях и это реально не работает - я проверил).
Однако у Гугла есть Google Custom Search API. Уверен, что и у Яндекса есть API, позволяющий либо за деньги, либо бесплатно в определенных пределах ЛЕГАЛЬНО получать результаты поиска по вебу.
У Гугла, например, указано, что API допускает бесплатное использование при не более чем 100 запросов в сутки.
Однако, я так и не понял, позволяют ли эти API осуществлять поиск в широких пределах.
При создании search engine в панели Гугла можно либо указать сайт, по которому предполагается осуществлять поиск, либо искать по всему вебу, но только среди сайтов с правильной разметкой (соответствующих schema.org).
У Яши я пока что-то вообще не нашел подходящий API (но признаюсь, я только начал искать).
А что бы хотелось: например, найти топ 100 (200, 300, 500... - сколько будет возможно) документов по заданному запросу (например, "Самостоятельное путешествие по Греции", ну или мало ли что еще) и получить URLы этих документов (в принципе мне больше ничего не нужно, но если будет возможность получить еще даты, например - будет здорово, мало ли пригодится).
В чем трудность парсинга?
В чем трудность парсинга?
В том что и гугл и яндекс отдают результаты поиска только "человеку" (браузеру). Если вы попытаетесь на своем сервере выполнить скрипт
Он выдаст пустую страницу. И так с любым запросом к гуглу.
Да и работать с JSON переменной намного приятнее чем парсить выдачу замешанную на javascript и бояться, что завтра вебмастера гугла или яши изменят выдачу и парсер перестанет работать.
Вот такие мысли.
PS. Но на самом деле если бы Гугл и Яша отдавали бы серверу свои страницы, я бы не заморачивался на API и делал бы парсер. Но пока не работает...
Неужели никто не знает?! :(
Если ваши знания заканчиваются на file_get_contents, то обратитесь к программистам, они вам напишут нормальный парсер.
Если ваши знания заканчиваются на file_get_contents, то обратитесь к программистам, они вам напишут нормальный парсер.
А какая разница какой функцией пользоваться? (это без иронии вопрос, неужели curl лучше бы справился?)
Вообще вопрос был, скорее не про PHP, а про гугловские и яндексовские API. Т.е. меня в первую очередь интересует как это сделать в "белую"
Я серьёзно вам написал совет. Если вы разницу между этими функциями не видите, то мой ответ ещё более актуален.
Я серьёзно вам написал совет. Если вы разницу между этими функциями не видите, то мой ответ ещё более актуален.
Прошу не зацикливаться на этом. Меня интересует в первую очередь API.