Нужен ли robots.txt ?

1 234
LM
На сайте с 30.11.2001
Offline
71
LiM
#21
Как писал ulcer
роботс.тхт является стандартом, но не для сайто-стоения, а для роботов, а точнее их поведения. и регламентирован в инструкциях по их созданию. своего рода культура программирования.
[...]
эти регламенты как правило находятся в учебниках по перлу и пхп. прочтя их, можно сделать выводы, нужен он в вашем случае, или нет.

Очень хорошо. Раз это стандарт, будьте бак добры, дайте ссылку на официальный текст этого стандарта.

Давайте не будем путать божий дар с яичницей.

Есть понятие "стандарт де-юре" и понятие "стандарт де-факто". Второе из них нельзя называть просто словом "стандарт", т.к. это не более, чем договоренность.

Да, я знаю, что неиспользование robots.txt роботом чревато тем, что его владельцев запинают. Но это НЕ стандарт - это рекомендация.

Вот Вам ссылка на наиболее официальный текст: http://www.robotstxt.org/wc/norobots-rfc.html

Надеюсь, шапку документа (особенно слово "draft") перевести будет не сложно.

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
LM
На сайте с 30.11.2001
Offline
71
LiM
#22
Дикий прикол - если этот файл не поставить в корень домена третьего уровня (мы обычно на такие домены ставим тестовые версии сайтов, чтобы клиент свой сайт мог посмотреть), и не "запереть" разделы, то Яндекс и Рамблер, не найдя этот файл, проиндексирует сайт (домен), который вы не хотите индексировать, но на который где-нибудь есть ссылка.

Никакого прикола. Если нет файла robots.txt, робот имеет полное право поступать так, как ему хочется.

Даже если такой файл есть, робот может постепать так, как хочет (см. выше). Правда его создателей запинают за такое. :)

Y
На сайте с 02.06.2003
Offline
104
#23

Подскажите несведущей. В robots.txt следует запрещать директории, которые видны в строке браузера или все ненужные пользователю? Вот, например, если есть директория INC, откуда берутся инклуды, ее надо запрещать или паук ее и так не увидит? И зачем многие запрещают индексирование директории с графикой типа IMAGES?

Ищу реальную проверенную партнерку для кулинарных сайтов
Avatar
На сайте с 18.05.2003
Offline
168
#24

Роботс.тхт полезен, если у вас несколько зеркал - в нем вы можете указать главный сайт(для яндекса директива хост:) Разделы /адм /админ и прочие итак проверяют хакеры регулярно, и у меня тоже, хотя в роботсе(да и на сервере) у меня их вовсе нет(каталогов этих). С другой стороны некоторые поисковики просто забивают на диссалоу, так что им все равно, есть у вас роботс или нет.

Avatar
На сайте с 18.05.2003
Offline
168
#25

Кстати, господа и дамы - мне в одной ветке(мной начатой) так ни кто и не ответил по поводу расширений роботс.тхт для разных SE. Что, никто не знает или делиться не хотите ;) ??

LD
На сайте с 12.06.2002
Offline
71
#26

есть еще такое соображение: отсутствие robots.txt забивает логи сервера ошибкой 404 при попытке роботов обратиться к этому файлу, что несколько портит общую картину статистики :)

NL
На сайте с 29.01.2003
Offline
212
#27
Что, никто не знает или делиться не хотите ???

Лично мне вопрос показался праздным\чисто академическим, без какой-либо насущной необходимости - отвечать на такие не очень-то и хочеться - не совсем понятно для чего Вам нужны эти расширения - для расширения кругозора? Некоторые роботы стандартные команды из robots.txt неправильно обрабатывают или не обрабатывают вообще, а Вы о расширениях говорите - по моему это как-то не актуально.

есть еще такое соображение: отсутствие robots.txt забивает логи сервера ошибкой 404 при попытке роботов обратиться к этому файлу, что несколько портит общую картину статистики

Я сделал robots.txt на 50% по этой причине - робот c alltheweb замучил!!!

Y
На сайте с 02.06.2003
Offline
104
#28

Мне никто не ответит?

[Удален]
#29
Подскажите несведущей. В robots.txt следует запрещать директории, которые видны в строке браузера или все ненужные пользователю? Вот, например, если есть директория INC, откуда берутся инклуды, ее надо запрещать или паук ее и так не увидит? И зачем многие запрещают индексирование директории с графикой типа IMAGES?

Следует запрещать директории, которые видны в строке браузера. То, к чему пользователи непосредственно не обращаются - надо запрещать через .htaccess. Директории с графикой запрещают, чтобы сэкономить трафик.

Avatar
На сайте с 18.05.2003
Offline
168
#30

Надо запрещать секретные дирректории обязательно, но делать это так:

запретить каталок ЛАЛАЛА и все что в нем

в этом каталоге сделать нормальный секретный каталог.

Положить в ЛАЛАЛА индекс.хтмл, чтобы не вываливался лист директорий, с урлом или редиректом на головную страницу.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий