Форум Практика оптимизации Любые вопросы от новичков по оптимизации

Парсеры выдачи и статистики кейвордов поисковиков

Скромный малый

21 декабря 2008, 09:41

328

Ребята, кто писал МАССОВЫЕ сервисы сбора статистики, поделитесь опытом плиз...

Нужны массовые (много запросов в сутки) рабочие алгоритмы парсинга по следующим направлениям:

1. Яндекс - выдача

2. wordstat

3. Google - выдача

4. adwords.google

5. Rambler - выдача

6. ad.rambler

Приведу решения, которые вижу. Дополните плиз и оспорьте:

1. yandex.xml (но только 1000 запросов в сутки), написано, что "Настоящее ограничение количества запросов не применяется в отношении сайтов, подключенных к Рекламной сети Яндекса согласно договору с Яндексом, предусматривающему возможность использования Сервиса". Это что значит, надо их директ для этого юзать, а другие легальные методы есть?

2. Как парсить, чтобы не банили? Может они продают доступ?

3. Банят ли за массовое обращение? Как парсить, чтобы не банили? Есть ли что-то вроде yandex.xml?

4. Вообще капча... Можно-ли как-то обойти (распознавалка)?... Может они продают доступ?

5. Банят ли за массовое обращение? Как парсить, чтобы не банили? Есть ли что-то вроде yandex.xml?

6. Слышал, что рамблер всячески извращается, чтобы не парсили автоматом...

Какие соображения? Хотелось бы конечно легальные варианты, чтобы потенциально не натыкаться на капчи и пр... Готовы даже платить...

Из (как вариант) нелегального, на сколько реализуем и перспективен вариант, с доступом роботом-парсером через прокси, которые на автомате проверяются и обновляются?

Заранее благодарю за ответы...

Лучший разгруппировщик запросов в рунете (http://semparser.ru/p/2959)

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Open AI тестирует память для ChatGPT

Парсеры выдачи и статистики кейвордов поисковиков