Списки прокси для парсинга выдачи Google?

12 3
Дмитрий Удимов
На сайте с 05.05.2010
Offline
274
14126

Надо парсить 200к+ и более запросов в выдаче Google, какие списки прокси (платные или бесплатные) или другие приемчики посоветуете?

Сейчас есть своя подсетка /28 но при парсинге в 5-10 потоков с IP часто стал ловить BAN по большинству IPшников.

Заранее спасибо за ответы и предложения.

P.S. Не надо тупо спамить рефками, пожалуйста. Я не против рефок, но обоснуйте нормально почему именно этот сервис и Ваш опыт работы с ним.

P.S.S. Услуги по стороннему парсингу не интересуют.

Топвизор — аккредитованный регистратор доменов .ru и .рф (https://topvisor.com/ru/domain-registration/) — честная цена 299 руб. за регистрацию и продление.
юни
На сайте с 01.11.2005
Offline
901
#1
Ditmar:
Надо парсить 200к+ и более запросов в выдаче Google

Насколько регулярно?

https://a-parser.com/ - парсер для профессионалов SEO, маркетологов, арбитражников и SaaS, https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
Дмитрий Удимов
На сайте с 05.05.2010
Offline
274
#2
юни:
Насколько регулярно?

Каждый день

юни
На сайте с 01.11.2005
Offline
901
#3

250-300 wmz в месяц стоит такой объём, в зависимости от подхода к парсингу.

Дмитрий Удимов
На сайте с 05.05.2010
Offline
274
#4
юни:
250-300 wmz в месяц стоит такой объём, в зависимости от подхода к парсингу.

Объем чего? Прокси?

LEOnidUKG
На сайте с 25.11.2006
Offline
1723
#5

Распознавание каптч не прикручивали?

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/
Дмитрий Удимов
На сайте с 05.05.2010
Offline
274
#6
LEOnidUKG:
Распознавание каптч не прикручивали?

Прикручено ) 20к без проблем парсим, а вот как безопасно парсить большее количество запросов 200к? 1м?

Cthulchu
На сайте с 09.09.2011
Offline
50
#7

какие задержки между запросами в одном потоке?

короче, у вас парсер должен делить по потоку на проксю и выжимать их до конца, при этом, выдавать рендомные юзерагенты. задержки лично я выставляю 3-5 секунд и даже каптчи не ловлю. иногда, когда делаю 1-3 секунды - получаю бан. в таком случае, я делаю сеспенд проксе на три часа, потом опять продолжаю парсинг с нее.

/28 - это что, 16 ойпе? маловато для таких работ. мы для парсинга яндекса тысячами прокси юзаем. преимущественно, свои. некоторые исп (в основном, в россии и америке) предлагают /25-/26 вместе с колоколом.

я смею всё, что смеет человек. кто смеет больше, тот не человек.
Дмитрий Удимов
На сайте с 05.05.2010
Offline
274
#8
Cthulchu:
какие задержки между запросами в одном потоке?

короче, у вас парсер должен делить по потоку на проксю и выжимать их до конца, при этом, выдавать рендомные юзерагенты. задержки лично я выставляю 3-5 секунд и даже каптчи не ловлю. иногда, когда делаю 1-3 секунды - получаю бан. в таком случае, я делаю сеспенд проксе на три часа, потом опять продолжаю парсинг с нее.
/28 - это что, 16 ойпе? маловато для таких работ. мы для парсинга яндекса тысячами прокси юзаем. преимущественно, свои. некоторые исп (в основном, в россии и америке) предлагают /25-/26 вместе с колоколом.

Мы используем задержку от 0-5 секунд сейчас.

User-Agent не меняем, а как вы поступаете с куками (генерится новая с каждым User-Agent)?

/28 - это 16 IP да

Cthulchu
На сайте с 09.09.2011
Offline
50
#9

делайте задержку, хотя бы. от 1 секунды. я при парсинге гугла делаю 3-5 секунд. в вашем случае это должно окупиться стабильностью шестнадцати потоков.

куки я каждый раз обнуляю, типа, куки не сохраняются у клиентов и, возможно, я не прав, но чтобы сохранять еще и куки, мне бы пришлось из каждого потока бадяжить полноценную сессию. на самом деле, мне влом было выдумывать под это ТЗ и я забил, ибо знал, что и без кук будет отлично парситься.

юзерагент важней кук.

юни
На сайте с 01.11.2005
Offline
901
#10
Ditmar:
Объем чего?

Запросов, суточная нагрузка.

Ditmar:
1м?

1200 wmz ориентировочно.

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий