Яндекс и Wget/1.9.1

HoSStiA
На сайте с 18.02.2004
Offline
144
644

Неужели YML-данные для Яндекс.Маркета собираются клиентом Wget? :eek: :eek: :eek:

Каждые 30 минут наблюдаю в логах:

213.180.193.108 - - [28/Nov/2006:11:25:52 +0300] "GET /yml.php HTTP/1.0" 200 79959 "-" "Wget/1.9.1"

213.180.193.108, судя по whois, относится к сети Яндекса, так что это не самодеятельность.

Во до чего у них техника дошла! Обозвались хотя бы YaGet =_)))))

BTW я недолюбливаю, по-жизни, посетителей с клиентом "Wget", с ними борюсь и стараюсь занести в черный список. ;)

P.S.: даже на памяти пара "червей", которые сканировали эксплоиты этой дрянью.

T.R.O.N
На сайте с 18.05.2004
Offline
314
#1

HoSStiA, Wget - это еще и одна из библиотек перла..... =)

А использование таких вещей, как и sendmail - почти букварные правила.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
Shema
На сайте с 01.12.2005
Offline
176
#2

wget - это отличная программа (которая кстати умеет подделывать любого user-agent'а, так что банить её особо смысла нет)! все прочие качалки отдыхают

пользуюсь ей и под win и под nix :)

Студия Design Coda (http://www.designcoda.ru/). Личные контакты: +7(903)1367564, skype:andrey.oshemkov, telegram:@oshemkov. WMID: 492025973671 (https://passport.webmoney.ru/asp/certview4.asp?wmid=492025973671), делаем и рекламируем сайты, мобильные приложения, ботов для Telegram.
HoSStiA
На сайте с 18.02.2004
Offline
144
#3
T.R.O.N:
HoSStiA, Wget - это еще и одна из библиотек перла..... =)
А использование таких вещей, как и sendmail - почти букварные правила.

А Яндекс - солидная фирма. И, когда речь идет о доступе к относительно закрытой коммерческой информации, можно было бы самоидентифицироваться не грабберо-подобным клиентом. :-P Переопределить User-Agent, например.

Shema:
wget - это отличная программа (которая кстати умеет подделывать любого user-agent'а, так что банить её особо смысла нет)!

Когда начинают рекурсивно сдирать сайт - обязательно забаню 🍾 Даже если клиент - Mozilla.

ЗЫ: хорошо, что у Perl нет стандартной библиотеки Teleport Pro =)

T.R.O.N
На сайте с 18.05.2004
Offline
314
#4
HoSStiA:
А Яндекс - солидная фирма. И, когда речь идет о доступе к относительно закрытой коммерческой информации, можно было бы самоидентифицироваться не грабберо-подобным клиентом. :-P Переопределить User-Agent, например.

OFF конечно, но какраз из-за солидности они и считают, что если запрос с их IP, то неважно что там и как запрашивается. Есть ощущение, что Вам нравится что-то банить. =)) Вы с яшей в этом очень похожи.

Если серьезно, к своим проектам, просеиваю частоты и интенсивность запросов + прокси и куки, а не имя агента и т.д.

HoSStiA
На сайте с 18.02.2004
Offline
144
#5
T.R.O.N:
OFF конечно, но какраз из-за солидности они и считают, что если запрос с их IP, то неважно что там и как запрашивается.

Это мания величия =)))

T.R.O.N:
Есть ощущение, что Вам нравится что-то банить. =)) Вы с яшей в этом очень похожи.

Неее, я просто не люблю, когда меня мониторят и парсят посторонние личности ;)

T.R.O.N:
Если серьезно, к своим проектам, просеиваю частоты и интенсивность запросов + прокси и куки, а не имя агента и т.д.

Смотрел для интереса, не приходил ли assessor.yandex.ru и прочие типы из этой ветки:

/ru/forum/96393

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий