Вопрос по robots.txt

12
I
На сайте с 29.04.2007
Offline
29
1653

Есть сайт - и нужно закрыть для индексации в robots.txt все файлы, кроме index.htm

Как это сделать и можно ли это сделать вообще?

Или придётся перечислять весь список названий страниц...

В документации ответ найти не смог...

Californiy
На сайте с 12.12.2006
Offline
95
#1
User-agent: googlebot

Disallow: /
Allow: /index.htm

Но это только для гугля.

А так вообще да, прийдеться перечислять. Перенесите лучше файлы пока в отдельную директорию и закройте ее.

Тружусь в sapiense.com.
I
На сайте с 29.04.2007
Offline
29
#2

Californiy, оки спасибо... то что нужно

F
На сайте с 24.08.2006
Offline
35
#3
Californiy:
Allow: /index.htm

Нет инструкции Allow, есть только Disallow. Файл robots.txt ничего не разрешает, только запрещает!

F
На сайте с 24.08.2006
Offline
35
#4
idweb:
Или придётся перечислять весь список названий страниц...

придется перечислять.

idweb:
В документации ответ найти не смог...

плохо искали http://robotstxt.org.ru/RobotstxtErrors#h83-15

Kislov
На сайте с 29.04.2006
Offline
185
#5

Пихаем страницы в подкаталог и запрещаем его к индексации. Все.

Rimlyanin
На сайте с 22.02.2006
Offline
200
#6
flashtown:
придется перечислять.

Если страниц таки очень много то можно сделать так:


Disallow: /a
Disallow: /b
Disallow: /c
Disallow: /d
Disallow: /e
Disallow: /f
Disallow: /g
Disallow: /h
Disallow: /j

.......
Disallow: /x
Disallow: /y
Disallow: /z

Естественно пропустив

Disallow: /i

что бы можно было проиндексировать /index.htm

Останется только перечислить страницы на i, но если и их много то


Disallow: /ia
Disallow: /ib
Disallow: /ic
......
Disallow: /iy
Disallow: /iz

Пропустив in

Ну и так далее...

Kislov
На сайте с 29.04.2006
Offline
185
#7

Если мне память не изменяет, то сплэш в конце ОБЯЗАТЕЛЕН.

И /i пропускать не нужно.

Это поддиректории, поисковые системы их не проиндексируют, а все остальное проиндексируют.

Rimlyanin, вам про роботс тоже не мешало бы почитать.

Rimlyanin
На сайте с 22.02.2006
Offline
200
#8
Kislov:
Если мне память не изменяет, то сплэш в конце ОБЯЗАТЕЛЕН.
И /i пропускать не нужно.
Это поддиректории, поисковые системы их не проиндексируют, а все остальное проиндексируют.

Rimlyanin, вам про роботс тоже не мешало бы почитать.

Т.е. Disallow: /index не закроет файл index.php а только папки index* ??

Kislov
На сайте с 29.04.2006
Offline
185
#9

Таксс.. Я про поддиректории написал. Ошибся.

Извините.

Rimlyanin
На сайте с 22.02.2006
Offline
200
#10
Kislov:
Таксс.. Я про поддиректории написал. Ошибся.
Извините.

ДА ничего, бывает, я сам тут три дня вообще не соображал почти из-за погоды...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий