правило для robots.txt - вопрос - Яндекс - Поисковые системы

116

ufaclub

31 марта 2011, 20:42

2144

http://www.site.ru/feedback.aspx?property_id=xxxx

как закрыть вообще индексацию всего что начинается на feedback.aspx......

Disallow: */feedback.aspx

так?:popcorn:

69

Delarante

31 марта 2011, 21:01

#1

ufaclub:
как закрыть вообще индексацию всего что начинается на feedback.aspx..

Вот так:

Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:

Disallow: /*feedback.aspx

U

116

ufaclub

31 марта 2011, 21:13

#2

Delarante:
Вот так:
Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx

спасибо 🙄

75

39

7tvn54w0

1 апреля 2011, 05:58

#3

Delarante:
Вот так:
Disallow: /feedback.aspx

Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx

а почему не так:

Disallow: *feedback.aspx

?

OW

4

OldWolf

1 апреля 2011, 06:21

#4

Если feedback.aspx встречается не только в корне, то так:
Disallow: /*feedback.aspx

7tvn54w0:
а почему не так:
Disallow: *feedback.aspx
?

Оба запретят любые URL c feedback.aspx, вклюая что-то вроде /catalog/feedback.aspx/node/item.php?blahblah

Disallow: feedback.aspx

Должно запретить любые URL начинающиеся с feedback.aspx, к примеру /feedback.aspx/node/item.php?blahblah

Но лучше делать так:

Disallow: /feedback.aspx

Если нужно запретить все URL, содержащие именно файл feedback.aspx (не каталог!) со всеми возможными параметрами, то делается так:

Disallow: feedback.aspx? # знак вопроса - в случае дополнительных параметров

Disallow: feedback.aspx$ # символ окончания строки в случае отсутствия доппараметров

Только файлы с именами типа anotherfeedback.aspx тоже будут исключаться.

Если хотите сделать как по учебнику можно извратиться так:

Disallow: /*/feedback.aspx?

Disallow: /*/feedback.aspx$

Пожалуй, это единственный кошерный вариант. :-)

K

737

Kost

1 апреля 2011, 06:42

#5

OldWolf:

Disallow: feedback.aspx? # знак вопроса - в случае дополнительных параметров
Disallow: feedback.aspx$ # символ окончания строки в случае отсутствия доппараметров

OldWolf:
Только файлы с именами типа anotherfeedback.aspx тоже будут исключаться.

Не будут они исключаться, это ваши фантазии.

Есть мнение, что все урлы у всех сайтов начинаются на /

И если у вас нет ни / ни * в начале, то директивы не сработают никогда. Вот такая засада.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.

Google: когда использовать rel=canonical, Глава Минкомсвязи не исключает Летние изменения в поиске

OW

4

OldWolf

1 апреля 2011, 06:54

#6

Kost:
Есть мнение, что все урлы у всех сайтов начинаются на /
И если у вас нет ни / ни * в начале, то директивы не сработают никогда. Вот такая засада.

Начинаются, и чо? Робот проверяет вхождение, а не соблюдение вами стандартов.

K

737

Kost

1 апреля 2011, 07:03

#7

OldWolf:
Робот проверяет вхождение

Давайте посмотрим. Надеюсь, что все выделенные слова вам понятны:

Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved.

Начинаются, и чо

Вот слово starts with и означает "начинаются с". Вот вам и "чо", через плечо.

Если слова непонятны, попробуйте в сервис Яндекса сунуть хост www.probkovorot.info и URL http://www.probkovorot.info/news/razvyazka-kosino-mkad/

При наличии строки в robots.txt

Disallow: news

Получите вот что:

Результаты проверки robots.txt
Используемые секции

Строка Сообщение

5: Disallow: news

Правило начинается не с символа '/' и не с символа '*'
URL Результат
http://www.probkovorot.info/news/razvyazka-kosino-mkad/ разрешен

Система для стабильного заработок Прошу оценить сайт Adwords: объявление выводится не

OW

4

OldWolf

1 апреля 2011, 07:45

#8

Kost:
Получите вот что:

Я уже привёл наиболее корректный вариант, не понимаю к чему вы затеяли этот спор.

На robots.txt нет стандарта. А ваша проверялка хавает и урлы с километровыми слешами подряд. И чо? В хелпе Яндекса приведены проверенные примеры которые точно будут работать. Им лучше и следовать, остальное - догадки и предположения.

Признаю ошибку только там где я указал о вхождении в любом месте. Таки да, робот это должен считать началом строки.

К слову, урл начинается не со слэша, а с указания схемы. А часть урла - урл-пас не включает ни слеш, ни get параметры. Поэтому если вы уж начали заниматься буквоедством, то давайте признаем что дока на которую вы ссылаетесь написана технически неграмотно. Но это бессмысленный флуд и спам, в который я ввязыватсья не собираюсь.

Настройка индексирования нового сайта Основные ошибки юзабилити Нeсколько очевидных причин проблем

166

Fruit

1 апреля 2011, 07:55

#9

OldWolf:
В хелпе Яндекса приведены проверенные примеры которые точно будут работать.

Там нет ни одного примера, где бы Disallow с непустым параметром не начинался бы со слеша.

OW

4

OldWolf

1 апреля 2011, 08:01

#10

Fruit:
Там нет ни одного примера, где бы Disallow с непустым параметром не начинался бы со слеша.

Я где-то писал что там есть такой пример? Я писал о том что лучше смотреть в доку Яндекса, а не в доку разработчика robots.txt, потому что они носят рекомендательный характер.

Что делать, чтобы попасть в ответы Google Bard

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

правило для robots.txt - вопрос