Заблокировали IP, как быть?

12
L
На сайте с 26.02.2008
Offline
25
2749

Нужно отпарсить сай, но не просто текст а вместе с картинками.

Парсер написал, он работал пока не заблокировали IP :mad: . Как это можно обойти? Прокси не предлагать(больше чем на 1000 страниц его не хватает).

LEOnidUKG
На сайте с 25.11.2006
Offline
1723
#1
Прокси не предлагать(

гггггг

Ну всё писец)))) Скажите владельцу, мол разблокируйте, я тут попарсю....

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/
Dreammaker
На сайте с 20.04.2006
Offline
570
#2
LEOnidUKG:
Скажите владельцу, мол разблокируйте, я тут попарсю....

Если не поможет, то http://browsershots.org/ и через FineReader :D

Мэкс
На сайте с 03.07.2005
Offline
67
#3

С технической точки зрения:

Динамика прокси + рандомайзер таймаутов

С моральной точки зрения:

Свяжитесь с владельцем сайта и попробуйте купить у него контент, ибо воровать нехорошо.

А еще лучше - займитесь чем нибудь полезным для людей

Знание некоторых принципов легко возмещает незнание некоторых фактов. К. Гельвеций
Z-Den
На сайте с 30.06.2007
Offline
25
#4
lokiby:
Нужно отпарсить сай, но не просто текст а вместе с картинками.
Парсер написал, он работал пока не заблокировали IP 😡 . Как это можно обойти? Прокси не предлагать(больше чем на 1000 страниц его не хватает).

И это наверное кто-то из тех людей которые со своего основного аккаунта на весь форум кричат, что воровать контент плохо)))

funnybunny
На сайте с 14.09.2002
Offline
348
#5
Мэкс:
А еще лучше - займитесь чем нибудь полезным для людей

и это верно, поддерживаю именно этот совет 🚬

W
На сайте с 19.06.2006
Offline
142
#6

А кто говорит, что парсить контент - плохо? Здесь технические вопросы обсуждаются, а не юридические и моральные.

ТС: попробуйте прикинуться ботом яндекса(другой ПС) - он-то должен кушать рес как-то. Если не поможет - сделайте поддержку кукисов (если не по js режется - поможет).

Вариантов бана - куча. Но прокси лучше, имхо. Особенно - искажающие.

Если реально нужно - обращайтесь.

zzzzz
На сайте с 12.12.2006
Offline
204
#7

Самое печальное во всём этом - это то что ТС абсолютно искренне полагал, что то что он делает вполне нормально и скорее всего очень удивился, что мы всем форумом не бросились помогать ему, бедненькому😂

/////
mfl
На сайте с 16.10.2006
Offline
134
mfl
#8
wayly:
А кто говорит, что парсить контент - плохо? Здесь технические вопросы обсуждаются, а не юридические и моральные.

ТС: попробуйте прикинуться ботом яндекса(другой ПС) - он-то должен кушать рес как-то. Если не поможет - сделайте поддержку кукисов (если не по js режется - поможет).
Вариантов бана - куча. Но прокси лучше, имхо. Особенно - искажающие.

Если реально нужно - обращайтесь. За умеренную плату сделаем ;)

Если IP забанили, хоть кем прикидывайся, не поможет.

Единственный выход менять IP, либо использовать прокси.

К счастью, смена ip беcполезна, ибо автору ресурса достаточно прописать еще одну строку в .htaccess, а прокси живут мало.

К стати, автор того ресурса немного не правильно поступил. Я бы для данного IP делал редирект на страницу со множеством внешних ссылок 😂, первый ап и сайт в бане.

Dreammaker
На сайте с 20.04.2006
Offline
570
#9
mfl:
IP делал редирект на страницу со множеством внешних ссылок

Я думаю как вариант можно в контент добавлять ссылки на себя (это если знать, что ТС не вырезает ссылки). :)

W
На сайте с 19.06.2006
Offline
142
#10

Во-первых, ссылки убиваются одним preg_replace.

Во-вторых, бан по IP, скорее всего, не через .htaccess дается. Ибо у меня сейчас в чеке 290-350 анонимных живых проксей в любой момент времени (в т.ч. и искажающих). Есть желание прописать все в .htaccess? 😂

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий