Индексируется запрещенное в robots.txt

12
A
На сайте с 23.11.2010
Offline
6
1392

В последний ап проиндексировались страницы такого типа:

http://сайт.ru/раздел/страница.html/feed (Комментарии на: .......)

хотя в robots.txt прописано

...

Disallow: */feed/

Disallow: */comments/

Disallow: /?feed=

...

До этого апа ничего подобного не было.

Подскажите, пожалуйста, что не так.

AS
На сайте с 12.01.2011
Offline
25
#1

Видимо я не один с этим столкнулся! Интересно, почему Яндекс начал 'класть' на robots?

kimberlit
На сайте с 13.03.2007
Offline
370
#2
andruhhh:
В последний ап проиндексировались страницы такого типа:
http://сайт.ru/раздел/страница.html/feed (Комментарии на: .......)
хотя в robots.txt прописано
...
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=

У тебя ссылка без слеша, а в правиле со слешем на конце. Так?

novitskii
На сайте с 11.06.2006
Offline
69
#3

Не правильно написано правило, поэтому и индексирует.

Напиши так

Disallow: /*feed*

или так

Disallow: /*feed

Продаю очень крутой движок для музыкальных сайтов. По вопросам в icq.
A
На сайте с 23.11.2010
Offline
6
#4
kimberlit:
У тебя ссылка без слеша, а в правиле со слешем на конце. Так?

В общем-то да. Вы считаете, что нужно в правиле добавить слеш?

Но до сегодня было же все нормально?!

И, кстати есть в роботе другие правила, например Disallow: /wp-admin (без слеша), но НЕ индексируются страницы, которые такого вида сайт/wp-admin/страница (со слешем)

kadaber-baber
На сайте с 23.03.2009
Offline
64
#5
andruhhh:
В общем-то да. Вы считаете, что нужно в правиле добавить слеш?
Но до сегодня было же все нормально?!
И, кстати есть в роботе другие правила, например Disallow: /wp-admin (без слеша), но НЕ индексируются страницы, которые такого вида сайт/wp-admin/страница (со слешем)

Цитируя Яндекс:

По умолчанию к концу каждого правила, описанного в robots.txt, приписывается '*'

kimberlit
На сайте с 13.03.2007
Offline
370
#6
kadaber-baber:
В общем-то да. Вы считаете, что нужно в правиле добавить слеш?

Он там есть. А в ссылке его нет.

Это правило не запрещает индексировать данную ссылку.

A
На сайте с 23.11.2010
Offline
6
#7
kimberlit:
У тебя ссылка без слеша, а в правиле со слешем на конце. Так?

Действительно, полазил по другим сайтам, проанализировал роботсы - так и есть: мою страницу с фидом яндекс вебмастер кушает, там где без слеша - пишет: запрещено в роботс. тхт.

Спасибо, что ткнул носом!

En@n
На сайте с 20.09.2007
Offline
56
#8

Посмотрел, один из своих проектов. В индексе много страниц http://URL поста/feed/

в роботс прописано Disallow: /feed/

Раньше все норм было.

Эх глюченный Яндекс стал

kimberlit
На сайте с 13.03.2007
Offline
370
#9
En@n:
Посмотрел, один из своих проектов. В индексе много страниц http://URL поста/feed/
в роботс прописано Disallow: /feed/
Раньше все норм было.
Эх глюченный Яндекс стал

Это не Яндекс глючный, а ты бестолковый.

Хоть бы почитал что про robots.

Твоя директива не запрещает эти адреса.

En@n
На сайте с 20.09.2007
Offline
56
#10

Во-первых, без оскорблений!

во-вторых,

чтож у меня неправильно, если до последнего апа все это прекрасно работало.

И чтож у меня не правильно если в хелпе яндекса написано

Disallow: /cgi-bin # блокирует доступ к страницам

#начинающимся с '/cgi-bin'

и чем отличается от feed ?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий