Нужен ли robots.txt ?

123 4
C
На сайте с 19.09.2001
Offline
120
#11

Если закрывать ничего не надо, то можно сделать следующее:

1. Не создавать robots.txt;

2. создать пустой;

3. создать по всем правилам и разрешить индексировать все.

в первых двух случаях робот волен поступать на свое усмотрение, в третьем я ему даю определенные инструкции, что несколько греет душу :).

Важно, что результат будет одинаковый.

Этот стандарт где-то озвучен или просто негласное общепринятое решение?

http://www.robotstxt.org/wc/norobots.html

ЗЫ Также исправно они ищут favicon.ico

Роботы ищут?!

AFAIK, иконка -- прерогатива браузера.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
oLL
На сайте с 27.03.2003
Offline
90
oLL
#12

Cherny, насчет favicon - ты прав.

Не там посмотрел.

Умное продвижение сайтов SmartSEO ( http://www.smartseo.ru/ ) | Lj ( http://koshkin.livejournal.com/ ) | SEO - хайку ( http://community.livejournal.com/ru_seo/151529.html ) | аудит сайтов ( http://www.site-audit.ru )
LM
На сайте с 30.11.2001
Offline
71
LiM
#13

Господа,

Вы кое что путаете: файлы robots.txt никогда не были стандартом - это не более, чем рекомендация, которая используется всеми т.к. она удобна. Если кто-то не использует robots.txt (как индексатор поисковика с KM.ru) его за это ругать никто не имеет право. Однако, часто в таких случаях у таких роботов начинаются проблемы с доступом к особо интересным сайтам... ;)

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
U
На сайте с 28.10.2001
Offline
109
#14

роботс.тхт является стандартом, но не для сайто-стоения, а для роботов, а точнее их поведения. и регламентирован в инструкциях по их созданию. своего рода культура программирования.

в этих же регламентах сказано, что при отсутствии обсуждаемого файл, робот должен вести себя обычным образом, т.е. жрать можно все что найдешь.

эти регламенты как правило находятся в учебниках по перлу и пхп. прочтя их, можно сделать выводы, нужен он в вашем случае, или нет.

некоторые из них (роботов) ими пренебрегают, но это офф-топик...

дёшево хостим блоги здесь (http://sgmanaged.com/ru/) и тут-же наполняем их (блоги) контентом (http://republisher.ru)
P
На сайте с 26.02.2002
Offline
73
#15

а как вам такой аспект:

указав в роботе директории вида /admin, /adm, /test и т.д.

вы упрощаете хакеру поиск точек для взлома сайта

Price OK - у нас самые свежие цены! (http://www.priceok.ru)
C
На сайте с 19.09.2001
Offline
120
#16
указав в роботе директории вида /admin, /adm, /test и т.д.
вы упрощаете хакеру поиск точек для взлома сайта

Если на файлы в этих директориях есть ссылки, то хакер их и так найдет. Зачем только такие ссылки ставить?

А если ссылок нет, то и указывать их в robots.txt совершенно незачем.

Сервер надо настраивать правильно + скрипты писать аккуратно.

wolf
На сайте с 13.03.2001
Offline
1183
#17
Во-вторых, очень часто бывает ситуация, когда робот, частенько бывает у забугорных, понюхав роботс и получив 400, разворачивается и уходит

Если такое и бывает, то туда ему и дорога, этому роботу. У всех мало-мальски достойных поисковиков роботы, не найдя robots.txt, справедливо полагают, что индексировать можно все, чем и занимаются.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
N
На сайте с 21.11.2001
Offline
152
#18

wolf, вечно ты придираешься :)

А остальные пункты не хочешь прокомментировать? ;)

wolf
На сайте с 13.03.2001
Offline
1183
#19
А остальные пункты не хочешь прокомментировать?

А что тут комментрировать? Если хочешь что-то запретить - выкладывай robots.txt с соответствующими директивами, если ничего не хочешь запрещать - то он и не нужен вовсе.

B
На сайте с 14.05.2003
Offline
10
bnz
#20

Всем привет!

Достоверно знаю вот что:

1. Рамблер и Яндекс учитывают файл для индексирования разделов (лично общался с их администрациями по поводу раскрутки сайтов клиентов)

2. Дикий прикол - если этот файл не поставить в корень домена третьего уровня (мы обычно на такие домены ставим тестовые версии сайтов, чтобы клиент свой сайт мог посмотреть), и не "запереть" разделы, то Яндекс и Рамблер, не найдя этот файл, проиндексирует сайт (домен), который вы не хотите индексировать, но на который где-нибудь есть ссылка. Мы так с одним тестовым сайтом заняли первое место в Яндексе, сами того не желая😂 Причем текст стоял тестовый, с каких-то новостей сдёрнутый.

bnz
123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий