Парсил сайт - забанили IP - купил ещё 1н - не работает

123 4
B
На сайте с 23.10.2006
Offline
170
3369

Ситуация такая - парсил сайт - за это получил бан по IP, подумал не беда - и купил у хостера ещё 1н + попросил прикрутить к новому IP (на томже VPS-е) новый домен

Но получается трабла - по новому IP я к домену доступ получаю, но если запускать из папки нового домена парсер (сто domen.ru/pareser.php?url=myip.ru что new_IP/pareser.php?url=myip.ru) - он иницируется на старом IP, а не на новом - как это исправить?

(IP проверял - путем скачивания странички myip.ru )

PS.

Парсер на PHP

PPS.

Для борцов за запрет ворвства контента сообщаю что парсеры пишут нетолько для того чтобы воровать ваши материалы (а уж если и воруют некотрые - учитесь их банить - это легко) но ещё и поисковые системы, и системы статистики, да мало чего можно напарсить ещё.

Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#1

Тема много раз поднималась. php.net в помощь.

С уважением, Борис Долгов. Администрирование, дешевые лицензии ISPsystem, Parallels, cPanel, DirectAdmin, скины, SSL - ISPlicense.ru (http://www.isplicense.ru/?from=4926)
B
На сайте с 23.10.2006
Offline
170
#2
Boris A Dolgov:
Тема много раз поднималась. php.net в помощь.

Щас пришол ответ от хостера - говорит что исходящие соединения с VPS инициируются только с 1го IP адреса.

Через сокеты это ограничение обходится?

Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#3
bimcom:
Щас пришол ответ от хостера - говорит что исходящие соединения с VPS инициируются только с 1го IP адреса.
Через сокеты это ограничение обходится?

Да.

Для curl тоже есть эти опции, но не помню на них ссылок.

B
На сайте с 23.10.2006
Offline
170
#4
Boris A Dolgov:
Да.
Для curl тоже есть эти опции, но не помню на них ссылок.

ООО с курлом привычнее :) щас буду искать.

K
На сайте с 12.07.2006
Offline
295
Kpd
#5
bimcom:
парсил сайт - за это получил бан по IP

И правильно, нефиг воровать.

B
На сайте с 23.10.2006
Offline
170
#6

Boris A Dolgov,

Спасиба за наводку!

Опция для CURL CURLOPT_INTERFACE - позволяет менять интерфейсы.

Самый прикол, что на некотрых VPS функция просто не сработала, но не на всех - наверное зависит от особенностей виртуализации!

SJ
На сайте с 16.03.2008
Offline
78
#7
bimcom:
Для борцов за запрет ворвства контента сообщаю что парсеры пишут нетолько для того чтобы тырить ваш говноконтент (за тырение которого вы даже банить роботов не умеете) но ещё и поисковые системы, и системы статистики, да мало чего можно напарсить ещё.

Я возможно ошибаюсь, но люди которые пишут парсер для поисковой системы или системы статистики не будут задавать подобный вопрос на форуме, а спокойно почитают доки. Потому как квалификация достойная. Ошибаюсь?

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
B
На сайте с 23.10.2006
Offline
170
#8
sokol_jack:
Я возможно ошибаюсь, но люди которые пишут парсер для поисковой системы или системы статистики не будут задавать подобный вопрос на форуме, а спокойно почитают доки. Потому как квалификация достойная. Ошибаюсь?

Ошибаетесь - взять хотябы меня - я далеко не профи в програмирование, даже проще сказать новичек.

PS.

Парсер страничек пишется даже мной за 1 минут максимум.

$url="сайтец";

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url); // set url to post to
curl_setopt($ch, CURLOPT_TIMEOUT, 20); // times out after 20s
$result = curl_exec($ch); // run the whole process
curl_close($ch);

Вот готовый парсер, а дальше делай с полученными данными все что хочешь используя строковые функции - разве необходимо гигантскую квалификацию?

B
На сайте с 03.02.2005
Offline
165
#9

парсер написать не сложно... чего ему там писать.. а вот ботов-участников всех соцсетей с своими блогами на фриблоргхостах и т.п. - вот тут уже уровень нужен.

Интеграция сайтов с 1С (товары, контрагенты, документы, заказы). Консультации и услуги. Есть готовые решения - быстро и недорого. Приглашаю к сотрудничеству агентства и веб-студии.
[Удален]
#10
betam:
парсер написать не сложно... чего ему там писать.. а вот ботов-участников всех соцсетей с своими блогами на фриблоргхостах и т.п. - вот тут уже уровень нужен.

Разные парсеры бывают... ;)

Две недели, не так давно, угрохали на нормальный парсер... Чтоб оперативы не хавал и парсил с нормальной скоростью(около 3-4 тысяч страниц в минуту при расходе 1гиг оперативы сервака)

Пришлось на перле писать, т.к. пхп тут совсем не годится.

P.S. В предидущем сообщении парсер будет выводить страницу, а не сохранять в переменную $result Чтоб сохранял надо добавить CURLOPT_RETURNTRANSFER...

P.P.S. Хотя если этот пример назвать парсером, то почему бы тогда не $result = file_get_contents('http://ya.ru/'); 🚬

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий