Вопрос по robots.txt

12
P
На сайте с 10.03.2008
Offline
168
468

Есть на сайте куча урл типа /bla-bla/?id=1&more=2

Нужно разрешить к индексации /bla-bla/?id=1, но запретить /bla-bla/?id=1&more=xxx

xxx может быть равным 1 или 2


User-agent: *
Disallow: /bla-bla/*&more=1
Disallow: /bla-bla/*&more=2

Верна ли такая запись?

Onu
На сайте с 10.01.2007
Offline
170
Onu
#1
pistol:
Есть на сайте куча урл типа /bla-bla/?id=1&more=2

Нужно разрешить к индексации /bla-bla/?id=1, но запретить /bla-bla/?id=1&more=xxx

xxx может быть равным 1 или 2

Цитата:
User-agent: *
Disallow: /bla-bla/*&more=1
Disallow: /bla-bla/*&more=2
Верна ли такая запись?

Нельзя. Пункт "Использование в Disallow символов подстановки"

P
На сайте с 10.03.2008
Offline
168
#2

Тоесть единственный вариант - выводить на таких страницах <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">?

Onu
На сайте с 10.01.2007
Offline
170
Onu
#3
pistol:
Тоесть единственный вариант - выводить на таких страницах <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">?

Можно. Но лучше в роботс ввести:

User-agent: *
Disallow: /*&more=1
Disallow: /*&more=2
P
На сайте с 10.03.2008
Offline
168
#4

Спасибо :)

S2
На сайте с 07.01.2008
Offline
611
#5
pistol:
Нужно разрешить к индексации /bla-bla/?id=1, но запретить /bla-bla/?id=1&more=xxx

Disallow: /*&more=*

Те роботы которые игнорируют символы подстановки, игнорируют зачастую и сам роботс, так что можно это не принимать в расчёт. Вообще стоит проверять под конкретную ПС, например для Яндекса тут: http://webmaster.yandex.ru/robots.xml

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
P
На сайте с 10.03.2008
Offline
168
#6
Str256:
Disallow: /*&more=*

Не подойдет это, так как такая штука запретит к индексации все разделы, а мне надо только /bla-bla/ с &more. Да еще всякие условия есть, основанные на других параметрах урл. Роботсу без * точно не под силу такое.

Так что просто из двига детектю параметры и вывожу <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> если нужно.

S2
На сайте с 07.01.2008
Offline
611
#7
pistol:
Не подойдет это, так как такая штука запретит к индексации все разделы, а мне надо только /bla-bla/ с &more. Да еще всякие условия есть, основанные на других параметрах урл. Роботсу без * точно не под силу такое.

Ну да. Про бла-бла, забыл, тогда:

Disallow: /bla-bla/*&more=*

Я звёздочку использую, всё нормально.

P
На сайте с 10.03.2008
Offline
168
#8

Противоречивая у вас информация :)

http://robotstxt.org.ru/RobotstxtErrors#h83-9

для гугла будет работать звездочка в дисаллов, а в яше нет, я правильно понял? :)

pistol добавил 11.01.2010 в 11:28

Еще вопросик.

Поступила непроверенная информация, что <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> игнорирует яндекс. Миф или реальность?

serg690
На сайте с 19.10.2008
Offline
102
#9
pistol:
для гугла будет работать звездочка в дисаллов, а в яше нет, я правильно понял?

У меня была похожая ситуация и Яша нормально воспринял символы подстановки.

Пример:

User-agent: Yandex
Disallow: /*action.php
Disallow: /*xml-rss2.php
Disallow: /*rsd.php
Disallow: /*catid

Все ненужные страницы были успешно исключены.

Лучше деньги в руке, чем журавль в небе. ►Miralinks (http://goo.gl/hG48e)
S2
На сайте с 07.01.2008
Offline
611
#10
pistol:
Противоречивая у вас информация

Кого вы спрашиваете? Звёздочка нормально работает и в Гугле и в Яндексе. А роботов, которые парсят сайты много, типа Flexum, может там не работает, впрочем не проверял.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий