Парсинг всех проиндексированных страниц

Satelliter
На сайте с 13.06.2008
Offline
96
3633

Добрый день.

Возникла необходимость в парсинге всех проиндексированных страниц с Яндекса. Искал и по форуму и по серчу, ничего ценного не нашел. Подскажите пожалуйста, каким инструментом или какими методами можно быстро и легко спарсить все проиндексированные страницы.

Заранее благодарю.

Отличная монетизация (http://gogetlinks.net/?inv=m0524g) для СДЛ.
DM
На сайте с 25.06.2010
Offline
3
#1
Satelliter:
Добрый день.

Возникла необходимость в парсинге всех проиндексированных страниц с Яндекса. Искал и по форуму и по серчу, ничего ценного не нашел. Подскажите пожалуйста, каким инструментом или какими методами можно быстро и легко спарсить все проиндексированные страницы.

Заранее благодарю.

Хотите спарсить всю индексную базу яндекса? Страшно подумать, зачем...

[Удален]
#2

Если надо получить список всех страниц в выдаче по определенному запросу (в том числе и пустому), то использую YandexParser. Скачивал с сайта http://topperharley.ru/

Satelliter
На сайте с 13.06.2008
Offline
96
#3
DrMoriarty:
Хотите спарсить всю индексную базу яндекса? Страшно подумать, зачем...

Имелось ввиду "спарсить проиндексированные страницы конкретного сайта".

Yahont:
Если надо получить список всех страниц в выдаче по определенному запросу (в том числе и пустому), то использую YandexParser. Скачивал с сайта http://topperharley.ru/

Спасибо, скачал. Yandex Parser оказался универсальным. Хоть мне и нужно парсить запросы, но там есть отличная функция - Или прямые запросы, куда и вставил http://yandex.ru/yandsearch?serverurl=www.site.ru&lr=209

mgmf
На сайте с 01.05.2007
Offline
203
#4

Нехорошо парсить чужое ;)

Место для Вашего сайта! Хостинг от 119 руб. в месяц! https://timeweb.com/ru/?i=102069 ! Домен .RU/.РФ в подарок!
Satelliter
На сайте с 13.06.2008
Offline
96
#5
mgmf:
Нехорошо парсить чужое ;)

А кто сказал чужое? Мне необходим список всех проиндексированных страниц моего сайта.

[Удален]
#6
Satelliter:
А кто сказал чужое? Мне необходим список всех проиндексированных страниц моего сайта.

вебмастер -> страницы в индексе -> выгрузить в файл.

это если вам только ваш нужен)

в противном случае вам нужен массовый парсинг)

Satelliter
На сайте с 13.06.2008
Offline
96
#7
Чеширский:
вебмастер -> страницы в индексе -> выгрузить в файл.
это если вам только ваш нужен)

в противном случае вам нужен массовый парсинг)

Пробовал, только смотрел на:

1. ЯВ > Мои сайты > Загружено роботом - на этой странице есть ссылка на экспорт, только экспортируются не все страницы, а "подразделы, содержащие более 10 страниц и занимающие более 1% от общего числа загруженных страниц";

2. ЯВ > Мои сайты > Страницы в поиске - здесь выводится список практически всех страниц, но нет ссылки на экспорт этого списка

F
На сайте с 10.05.2009
Offline
91
#8

Satelliter, страниц сколько у сайта? если больше 1000, тогда будет сложновато парсить...

Попробуйте AGGRESS Parser

Satelliter
На сайте с 13.06.2008
Offline
96
#9
Filchakov:
Satelliter, страниц сколько у сайта? если больше 1000, тогда будет сложновато парсить...
Попробуйте AGGRESS Parser

Страниц именно у этого сайта менее 1000 в индексе, поэтому спарсить с Яндекса легче, нежели парсить с сайта все страницы, а затем чекать на индексированность. А вообще, в случае, если у сайта больше 1000 страниц в индексе, то их всех никак не спарсишь с Яндекса, остается только чекать каждую страницу на индексированность.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий