Вопрос: убрать не нужные страницы с помощью robots.txt

kievyes
На сайте с 31.05.2011
Offline
36
619

Вопрос такой: на сайте страницы типа - домен/index.php?p='X'&s='Y' где X и Y - переменные. А проиндексировались часть ссылок, как домен/?p='X'&s='Y' , как с помощью robots.txt запретить к индексу страницы типа домен/?p='X'&s='Y' и разрешить домен/index.php?p='X'&s='Y'. Чтобы актуально и для Яндекса и Google?

siv1987
На сайте с 02.04.2009
Offline
427
#1

Disallow: /?p=

Этого должно быть достаточно. Но здесь проще было бы через htaccess поставить редирект.

kievyes
На сайте с 31.05.2011
Offline
36
#2
siv1987:
Disallow: /?p=
Этого должно быть достаточно. Но здесь проще было бы через htaccess поставить редирект.

так если я поставлю такой disallow - то я думаю, что выпадут все страницы с индекса, так как ?p= - присутствует вовсех страницах.

Щас я пробую следующий код:

User-agent: *

Allow: /index

Disallow: /

Что скажете, так пойдет?

Speaker19
На сайте с 20.12.2010
Offline
224
#3

kievyes, если написали вариант файла роботс и не знаете будет ли он работать, то просто проанализируйте его через webmaster.yandex.ru/robots

Дешевая и эффективная реклама ВКонтакте: сообщества, рекламные посты, аналитика. (http://adspoiler.com/r/16336752) Имеются свободные рекламные места в соц. сетях? (http://partner.apishops.com/soc.htm)
kimberlit
На сайте с 13.03.2007
Offline
370
#4
kievyes:
так если я поставлю такой disallow - то я думаю, что выпадут все страницы с индекса

А ты не думай, мыслитель. Ты мануалы почитай для начала.

Тебе правильно посоветовали.

[Удален]
#5

А что Гугл и Яндекс уже совсем стал не актуален как пс?

W
На сайте с 22.01.2012
Offline
12
wid
#6
siv1987:
Disallow: /?p=

Я таким образом исключил страницу из индекса в роботс.тхт

Но сейчас посмотрел в яндексвебмастере эта страница загружена 😮

Что я не так написал в роботс.тхт😕

Мне нужно,что бы яндекс и гугл не индексировали эту страницу.

Tima44
На сайте с 06.07.2011
Offline
163
#7

Чтобы не плодить темы, спрошу здесь. В общем у меня на сайте появились дубли с адресами сайт/2012-06...

Чтобы запретить их, я делаю Disallow: /2012 ??

И еще вопрос, через какое время изменения в роботс вступают в силу? Нужно как-то роботу сообщать, что роботс сменился?

Настройка и ведение контекстной рекламы. Аудит рекламных кампаний за 0 руб. (/ru/forum/858137)
AA
На сайте с 25.05.2012
Offline
2
#8

Если вы поставите:

Disallow: /?p=

то все будет нормально

Выпадут именно страницы, где после / идет ?.

Вот если вы напишите /*?p, вот тогда выпадут и те, которые /index?p

А впрочем попробуйте всяко и проверьте через панели яндекса или гугла

И для Tima44

Disallow: /2012*

Ну если конечно вам надо заблокировать все страницы с /2012

а сообщать роботу не надо - сам увидит. У меня, например, при внесении изменений в роботс гугл их видит в срок от часов до 1 суток. Думаю, зависит от частоты обхода роботом. Другой вопрос - когда он дубли из индекса выкинет. Часть моих дублей до сих пор в соплях гугла висит, хотя удалял через панель. А как закрыть в хтасссес пока не придумал.

Tima44
На сайте с 06.07.2011
Offline
163
#9
Alex A:

И для Tima44
Disallow: /2012*
Ну если конечно вам надо заблокировать все страницы с /2012
а сообщать роботу не надо - сам увидит. У меня, например, при внесении изменений в роботс гугл их видит в срок от часов до 1 суток. Думаю, зависит от частоты обхода роботом. Другой вопрос - когда он дубли из индекса выкинет. Часть моих дублей до сих пор в соплях гугла висит, хотя удалял через панель. А как закрыть в хтасссес пока не придумал.

Так нужно Disallow: /2012* или Disallow: /2012 ?? Символ "*" обязательно нужен?

AA
На сайте с 25.05.2012
Offline
2
#10

* - значит любой набор символов. Т.е. если вы ставите * до 2012, то значит до 2012 могут быть любые символы, если после - значит после. Если оставите без *, то будет закрыта только страница /2012 и никакая другая

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий