правило для robots.txt - вопрос

12
U
На сайте с 24.02.2009
Offline
116
2119

http://www.site.ru/feedback.aspx?property_id=xxxx

как закрыть вообще индексацию всего что начинается на feedback.aspx......

Disallow: */feedback.aspx

так?:popcorn:

Delarante
На сайте с 13.07.2008
Offline
69
#1
ufaclub:
как закрыть вообще индексацию всего что начинается на feedback.aspx..

Вот так:

Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:

Disallow: /*feedback.aspx

U
На сайте с 24.02.2009
Offline
116
#2
Delarante:
Вот так:
Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx

спасибо 🙄

75
На сайте с 29.01.2011
Offline
39
#3
Delarante:
Вот так:
Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx

а почему не так:

Disallow: *feedback.aspx

?

OW
На сайте с 07.12.2010
Offline
4
#4
Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx
7tvn54w0:
а почему не так:
Disallow: *feedback.aspx
?

Оба запретят любые URL c feedback.aspx, вклюая что-то вроде /catalog/feedback.aspx/node/item.php?blahblah

Disallow: feedback.aspx

Должно запретить любые URL начинающиеся с feedback.aspx, к примеру /feedback.aspx/node/item.php?blahblah

Но лучше делать так:

Disallow: /feedback.aspx

Если нужно запретить все URL, содержащие именно файл feedback.aspx (не каталог!) со всеми возможными параметрами, то делается так:

Disallow: feedback.aspx? # знак вопроса - в случае дополнительных параметров

Disallow: feedback.aspx$ # символ окончания строки в случае отсутствия доппараметров

Только файлы с именами типа anotherfeedback.aspx тоже будут исключаться.

Если хотите сделать как по учебнику можно извратиться так:

Disallow: /*/feedback.aspx?

Disallow: /*/feedback.aspx$

Пожалуй, это единственный кошерный вариант. :-)

K
На сайте с 31.01.2001
Offline
737
#5
OldWolf:

Disallow: feedback.aspx? # знак вопроса - в случае дополнительных параметров
Disallow: feedback.aspx$ # символ окончания строки в случае отсутствия доппараметров
OldWolf:
Только файлы с именами типа anotherfeedback.aspx тоже будут исключаться.

Не будут они исключаться, это ваши фантазии.

Есть мнение, что все урлы у всех сайтов начинаются на /

И если у вас нет ни / ни * в начале, то директивы не сработают никогда. Вот такая засада.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
OW
На сайте с 07.12.2010
Offline
4
#6
Kost:
Есть мнение, что все урлы у всех сайтов начинаются на /
И если у вас нет ни / ни * в начале, то директивы не сработают никогда. Вот такая засада.

Начинаются, и чо? Робот проверяет вхождение, а не соблюдение вами стандартов.

K
На сайте с 31.01.2001
Offline
737
#7
OldWolf:
Робот проверяет вхождение

Давайте посмотрим. Надеюсь, что все выделенные слова вам понятны:

Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved.
Начинаются, и чо

Вот слово starts with и означает "начинаются с". Вот вам и "чо", через плечо.

Если слова непонятны, попробуйте в сервис Яндекса сунуть хост www.probkovorot.info и URL http://www.probkovorot.info/news/razvyazka-kosino-mkad/

При наличии строки в robots.txt

Disallow: news

Получите вот что:

Результаты проверки robots.txt
Используемые секции

Строка Сообщение

5: Disallow: news

Правило начинается не с символа '/' и не с символа '*'
URL Результат
http://www.probkovorot.info/news/razvyazka-kosino-mkad/ разрешен
OW
На сайте с 07.12.2010
Offline
4
#8
Kost:
Получите вот что:

Я уже привёл наиболее корректный вариант, не понимаю к чему вы затеяли этот спор.

На robots.txt нет стандарта. А ваша проверялка хавает и урлы с километровыми слешами подряд. И чо? В хелпе Яндекса приведены проверенные примеры которые точно будут работать. Им лучше и следовать, остальное - догадки и предположения.

Признаю ошибку только там где я указал о вхождении в любом месте. Таки да, робот это должен считать началом строки.


К слову, урл начинается не со слэша, а с указания схемы. А часть урла - урл-пас не включает ни слеш, ни get параметры. Поэтому если вы уж начали заниматься буквоедством, то давайте признаем что дока на которую вы ссылаетесь написана технически неграмотно. Но это бессмысленный флуд и спам, в который я ввязыватсья не собираюсь.

Fruit
На сайте с 15.07.2008
Offline
166
#9
OldWolf:
В хелпе Яндекса приведены проверенные примеры которые точно будут работать.

Там нет ни одного примера, где бы Disallow с непустым параметром не начинался бы со слеша.

OW
На сайте с 07.12.2010
Offline
4
#10
Fruit:
Там нет ни одного примера, где бы Disallow с непустым параметром не начинался бы со слеша.

Я где-то писал что там есть такой пример? Я писал о том что лучше смотреть в доку Яндекса, а не в доку разработчика robots.txt, потому что они носят рекомендательный характер.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий