Вопрос по robots.txt

А
На сайте с 14.11.2003
Offline
150
796

Посмотрел недавно robots.txt одного известного сайта и обнаружил такую конструкцию...

User-Agent: DISCo Pump, Wget, WebZIP, Teleport Pro, WebSnake, Offline Explorer, Web-By-Mail, Teleport Pro/1.29, Scooter-W3-1.0
Disallow: /

В чем ее смысл?

Неужели это убережет от скачивания сайтов различными оффлайн-браузерами?

Можно ли ее применить по отношению к сборщикам e-mail?

Nikolai Popkov
На сайте с 07.06.2001
Offline
291
#1

В настройках Teleport есть раздел - кем представляться, по умолчанию - собой.

То есть если скачиватель не лез в настройки - а большинство и не знает где они, то такая запись - поможет. Уже легче.

партнерские программы (http://www.ebanners.ru/viewforum.php?f=7), словарь термины SEO (http://www.ebanners.ru/viewtopic.php?t=548) Форум маркетинг (http://www.reclama.su/) Reclama.Su, обмен ссылками (http://www.ebanners.ru/viewforum.php?f=13), Reklama.SU: контекстная реклама (http://www.reklama.su/) по цене Яндекса+продвижение за результат
А
На сайте с 14.11.2003
Offline
150
#2
Как писал Nikolai Popkov
В настройках Teleport есть раздел - кем представляться, по умолчанию - собой.
То есть если скачиватель не лез в настройки - а большинство и не знает где они, то такая запись - поможет. Уже легче.

Хм... не уверен. То есть вы хотите сказать, что такие программы запрашивают файл robots.txt и слушаются его?

А про сборщики мыла как думаете... прокатит?

ER
На сайте с 19.11.2002
Offline
107
#3
Неужели это убережет

Нет. Во-первых robots.txt "известного сайта" составлен неверно, по стандарту в User-Agent можно записывать только одного агента, либо всех сразу с помощью "*". А во-вторых, точно не знаю, но очень сомневаюсь что эти "качалки" вообще будут запрашивать robots.txt :)

А
На сайте с 14.11.2003
Offline
150
#4
Как писал EvgRen
Нет. Во-первых robots.txt "известного сайта" составлен неверно, по стандарту в User-Agent можно записывать только одного агента, либо всех сразу с помощью "*".

Ну не знаю. Известный сайт - это be1.ru.

А во-вторых, точно не знаю, но очень сомневаюсь что эти "качалки" вообще будут запрашивать robots.txt :)

Ура! Такая конструкция действительно работает. Не поленился, скачал этот TeleportPro версии 1.29.

Пробую с нормальным роботсом - сайт скачивается без проблем.

Добавляю конструкцию - ничего не выходит. Скачивается один index.html.

Думаю это работает и для других оффлайн браузеров.

Эх... жаль не могу проверить на сборщиках e-mail по причине их отсутствия.

Буду ставить эксперимент на юзер-агентах этих сборщиков. Сообщу на форуме.

Nikolai Popkov
На сайте с 07.06.2001
Offline
291
#5
То есть вы хотите сказать, что такие программы запрашивают файл robots.txt и слушаются его?

разработчики программ могут в принципе это сделать.

А про сборщики мыла

нет

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий