ROBOTS.TXT - запретить .../?catalogue=&status=, но не ../?catalogue=

12 3
Гриша К.
На сайте с 14.12.2005
Offline
28
1941

Здравствуйте.

Подскажите пожалуйста как запретить индексацию страницы с параметрами:

Запретить надо все страницы где есть параметр status:

http://site.ru/cat/?catalogue=&status=Delete

http://site.ru/cat/?catalogue=&status=No

http://site.ru/cat/?site=&status=Delete

http://site.ru/cat/?site=&status=No

Мои предположения такие:

Вариант1:

Disallow: /cat/?catalogue=&status=Delete

Disallow: /cat/?catalogue=&status=No

Disallow: /cat/?site=&status=Delete

Disallow: /cat/?site=&status=No

или вообще без cat?

Disallow: /cat/?catalogue=&status=*

или вообще без cat? Disallow: /?catalogue=&status=*

Невкоем случа нелбзя, чтобы была запрещена страница http://site.ru/cat/?catalogue=, т.е. без параметра status.

B
На сайте с 07.10.2004
Offline
114
#1

Гриша К., читаем хелп Я.

User-Agent: *

Disallow: /cat/?catalogue=&status=

Disallow: /cat/?site=&status=

Бородин Антон. 411-22-05, icq 199228260, bomass [at] ya.ru Домен .ru за 6,3$ (http://webst.ru/?id=146)
Sir[MAI]
На сайте с 22.10.2002
Offline
147
#2

Там же в хелпе советую почитать про Noindex, Nofollow

С уважением, Сергей
Гриша К.
На сайте с 14.12.2005
Offline
28
#3

Спасибо большое за ответы.

Читать хелп вы имеете в виду это http://www.yandex.ru/info/webmaster2.html

Что нужно писать User-Agent: *, это я понимаю, спасибо.

У меня есть руквовдство, но про параметры не у меня не у яндекса ненаписано.

Я все боюсь, что Disallow: /cat/?site=&status= , может запрещать вообще всю страницу.

Ну я тоже подумал использовать мета заголовки:

Чтобы: <META NAME="ROBOTS" CONTENT="NOINDEX"> выводилось, когда идет параметр status

А вы кстати не занете таких скриптов, которые например показывают правильсность составления robots.txt, я один такой нашел, но он не работает: http://kako.yandex.ru/cgi-bin/test-robots?host=http://

Очень было бы удобно проверить правильность работы файла.

А мне кстати NOFOLLOW как раз нужен, чтобы ссылки со страницы не индексировал (они прямые, а он их не индексирует) - это страница недобросовестных сайтов.

FlyAway
На сайте с 01.06.2005
Offline
439
#4

проверьте на правильность свой робот.тхт для Я - http://www.yandex.ru/cgi-bin/test-robots?host=ввв.домен.ру

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)
Гриша К.
На сайте с 14.12.2005
Offline
28
#5

FlyAway, спасибо за ссылку.

K
На сайте с 10.03.2004
Offline
254
#6

Гриша К., а также работает ли роботс можно проверить, удаляя страницы запрещеннные в роботсе, вот этой формочкой:

http://webmaster.yandex.ru/delurl.xml

Белых оптимизаторов, работающих над внешними факторами, не бывает. И да, мой блог (http://blog.skobeeff.ru/).
Гриша К.
На сайте с 14.12.2005
Offline
28
#7

Kostya, спасибо за совет, как-то не обращад внимание на эту форму.

Гриша К.
На сайте с 14.12.2005
Offline
28
#8

А ВОТ ЕЩЕ ТАКОЙ ВОПРОС.

Вот например в robots.txt, стоит запрет на индексацию каталога /catalog/

Я так понимаю, что поисковики могут только проиндекировать те страницы на которые есть ссылка с любой другой проиндексированной страницы сайта (например с главной), то если на эту папку нет ссылок с других страниц, то поисковик ее не проиндексирует, т.е. в robots.txt ее можно вообще не указывать?

B
На сайте с 07.10.2004
Offline
114
#9
Гриша К.:
У меня есть руквовдство, но про параметры не у меня не у яндекса ненаписано.

Там все написано.

FlyAway
На сайте с 01.06.2005
Offline
439
#10

Гриша К., тут работает принцип: то что не запрещено, то разрешено...

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий