Опять о robots.txt

12
admad
На сайте с 22.06.2004
Offline
126
1108

Такая конструкция в роботс.тхт:

Disallow: /service/publication/?page=

работает?

Подразумевается что не должны индексироваться страницы вида:

http://www.domain.ru/service/publication/?page=2

...

http://www.domain.ru/service/publication/?page=n

B
На сайте с 07.10.2004
Offline
114
#1

Именно такая интрукция в роботсе и работает:)

Бородин Антон. 411-22-05, icq 199228260, bomass [at] ya.ru Домен .ru за 6,3$ (http://webst.ru/?id=146)
admad
На сайте с 22.06.2004
Offline
126
#2

Хм, странно, получается, что увидев такую шляпу в роботе, Яндекс не пойдет вообще на подобный адрес. НО! Сегодня разбирал логи и увидел что ему по барабану всё это. Да и в индексе страница с таким URL есть.

В чем же дело?

K
На сайте с 31.01.2001
Offline
737
#3

А что это там у вас пустая строка делает, причем в трех местах?

...

...

Disallow: /commercialsale/warehouse/

Disallow: /newbuildings/rial?

...

...

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
admad
На сайте с 22.06.2004
Offline
126
#4

Разве пустая строка имеет значение?

B
На сайте с 07.10.2004
Offline
114
#5
Разве пустая строка имеет значение?

Всякое бывает...

Еще можете попробывать User-agent: Yandex

ND
На сайте с 19.08.2004
Offline
163
#6

admad, "robots.txt глазами Яндекса" - http://kako.yandex.ru/cgi-bin/test-robots

admad
На сайте с 22.06.2004
Offline
126
#7
admad, "robots.txt глазами Яндекса" - http://kako.yandex.ru/cgi-bin/test-robots

не маленький поди :) что с пустыми строками что без пустых строк пишет одно и тоже, но все равно ходит если встречается ?

C
На сайте с 19.09.2001
Offline
120
#8

admad, перечитайте стандарты, там ответы на большую часть ваших вопросов.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
admad
На сайте с 22.06.2004
Offline
126
#9
перечитайте стандарты, там ответы на большую часть ваших вопросов

Этот стандарт фактически переведен в FAQ Яндекса. И естествеено я его читал... Но вот непонятки есть....

Там, в качестве примера указан такой "атрибут":

Disallow: /~joe/private.html

Это понятно что к нидексации запрещен private.html, а если написать так:

Disallow: /~joe/private

???? Что будет? Если у меня мод реврайт настроен так что пересылает privat на privat.html... Я конечно понимаю что это уже мои проблемы как у меня настроен mod-rewrite :) но всё же... хотелось бы узнать у гуру, есть ли методы, позволяющие в роботс.тхт закрывать страницы с УРЛ указанными выше

K
На сайте с 31.01.2001
Offline
737
#10
Разве пустая строка имеет значение?

The format logically consists of a non-empty set or records, separated by blank lines.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий