- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
У меня такой вопрос. Мне надо получить все проиндексированные страницы одного сайта Яндексом. Если ли программа, которая может это сделать? Отпарсить не получается, потому что выдача идёт максимум 50 штук на страницу, а там около 400 000 страниц проидексировано.
site-auditor - хотя не подойдет...
Мне надо получить все проиндексированные страницы одного сайта Яндексом. Если ли программа, которая может это сделать? Отпарсить не получается, потому что выдача идёт максимум 50 штук на страницу, а там около 400 000 страниц проидексировано.
Да, тут есть принципиальное ограничение. И не потому, что по 50 штук на страницу (всегда можно зайти на следующую страницу), а потому что общее ограничение - 1000 результатов поиска.
Вы можете попробовать так:
url="www.site.ru/a*"
url="www.site.ru/b*"
....
url="www.site.ru/1*"
.....
Если брать комбинации из 2-3 символов, можно перебрать все. Только это надо делать с умом, если, например все страницы сайта кроме главной
www.site.ru/content/pages/******* :).
Думаю, идея понятна. Вот только Яндекс не обрадуется такому количеству запросов, да и зачем.
Page Promoter Bar показывает проиндексированные Яндексом страницы, можно предположить, что программа Page Promoter может выводить этот список. Но это всего лишь предположение.
Отпарсить не получается, потому что выдача идёт максимум 50 штук на страницу, а там около 400 000 страниц проидексировано
А XML?