Нужно разработать парсер выдачи яндекса

M
На сайте с 20.01.2009
Offline
221
770

Нужно разработать парсер выдачи яндекса, например набираю в скрипте слово "стройка в москве" поисковик выдает сайты по данному запросу, вот нужно спарсить урл этих сайтов- хотелось бы заметить, что это краткое ТЗ. Желающие подзаработать в личку за подробным ТЗ

Мониторинг, анализ и проверка позиций сайта в поисковых системах (http://allpositions.ru/redirect/820)
[Удален]
#1
Morfin:
Нужно разработать парсер выдачи яндекса, например набираю в скрипте слово "стройка в москве" поисковик выдает сайты по данному запросу, вот нужно спарсить урл этих сайтов- хотелось бы заметить, что это краткое ТЗ. Желающие подзаработать в личку за подробным ТЗ

Allsubmitter для этих целей уже не годится?

M
На сайте с 20.01.2009
Offline
221
#2

serg-deev, как подскажите? с указанием региона?

13485120
На сайте с 14.07.2008
Offline
137
#3

делай цикл скоко хочешь страниц

$html = file_get_contents(" http://yandex.ru/yandsearch?p= [номер страницы] &text= [запрос] ");
preg_match_all("!<span class=\"green_url\">(.*?)\&nbsp;!is",$html,$links); $links=$links[1];

из links на каждом шаге выгружай массив урлов. примерно както так. вот весь ваш парсер, который нужно разработать =)

пробелы в адресе естесственно убрать.

ЗЫ если нужно добавить поиск из определённого региона - добавляйте &lr= [номер региона] (для Москвы например 213)

[Удален]
#4
Morfin:
serg-deev, как подскажите? с указанием региона?

извините, про регионы не подумал

serg-deev добавил 19.05.2009 в 12:48

13485120:
ЗЫ если нужно добавить поиск из определённого региона - добавляйте &lr= [номер региона] (для Москвы например 213)

для других можно подсмотреть в кукисах по имени yandex_gid

M
На сайте с 20.01.2009
Offline
221
#5

спасибо serg-deev сделал

[Удален]
#6

Подскажите, как напарсить все ссылки на проиндексированные страницы своего сайта?

Всего страниц в индексе - 40 000

Из панели вебмастера их никак не экспортировать?

TopperHarley
На сайте с 24.03.2009
Offline
350
#7
PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий