вопрос по robots.txt

12
Каширин
На сайте с 03.01.2004
Offline
1030
#11
chelll:
а как же такая организация?
/public_html/файлы сайта

и роботс читается именно тот который лежит не здесь /
а в файлах сайта /public_html/файлы сайта

О5 25!

Поисковый робот - не файловая система. Он стремится смотреть на сайт глазами пользователя. Пользователь видит ваш паблик несчастный ха-тэ-мэ-лэ? Нет. И Робот не видит.

Хотите знать, правильно ли положили robots.txt ? Наберите в броузере http://www.site.ru/robots.txt - и вы увидите то, что будет запрашивать робот.

nickspring
На сайте с 29.03.2006
Offline
228
#12
MaulNet:
Небольшой моментик у меня создал недоумение. Допустим, папка главная сайта - в ней /html/ (иногда это /www/) со всеми файлами и, собственно, с robots.txt, /cgi-bin/, /logs/ и другие служебные папки. Так вот, если в robots.txt прописать Disallow: /cgi-bin/, например, будет ли поисковик искать эту папку относительно папки /html/ (то бишь /html/cgi-bin/) или додумается спуститься на ступень ниже? Вроде бы очевидная вещь, да вот хотелось бы уточнить.

через HTTP Вы никогда не получите доступ к папке выше уровня корня... другое дело что cgi-bin - особая папка, специально обозначенная как папка для выполнения cgi-скриптов... и, соответственно, файлы этой папки доступны для исполнения по адресу http://www.site.ru/cgi-bin/blabla.cgi

MaulNet
На сайте с 07.08.2005
Offline
348
#13

nickspring, исключительно cgi-bin? Под tmp или logs папки, которые находяться в "/", данное правило не подходит и запретить их индексацию нельзя?

nickspring
На сайте с 29.03.2006
Offline
228
#14

По-моему Вы путаете немного... обычно служебные папки сервера (logs, cgi-bin, tmp и прочее) просто помещаются в одном каталоге с папкой www (html и другие вариации) ... делается с учетом того, что обращаясь к сайту через браузер человек, робот ( не важно кто ) может получить доступ только к файлам корневой директории сайта т.е. www в данном случае (ну и ко всем вложенным в эту директорию данным)... т.е. к logs, tmp и прочей лабуде получить доступ через браузер в данном случае невозможно принципиально, и, соответственно, не имеет смысла их запрещать в robots.txt или еще где-либо... cgi-bin тоже лежит, как правило, рядом с logs, но, повторюсь, для него описывается специальное правило в конфигурации веб-сервера.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий