Небольшой вопрос по robotx.txt

root
На сайте с 04.07.2006
Offline
196
699

Здравствуйте!

в роботс вот такие строки:

User-agent: *

Disallow: /tag/*

но страницы вида:

/tag/novinki и др.

есть в индексе, причем не на одном сайте так, на нескольких.

так и должно быть? или robots неправильно составлен?

Ctulhu
На сайте с 21.05.2005
Offline
222
#1
root:
в роботс вот такие строки:

давно они там?

попробуйте написать

Disallow: /tag*

или без звездочек

S
На сайте с 17.10.2003
Offline
341
#2

Звездочка в строке Disallow: /tag/* лишняя

Сделайте так:

User-agent: *

Disallow: /tag/

это должно закрыть от индексации и /tag/ и /tag/novinki и /tag/novinki.htm ...

Не все ссылки одинаково полезны ( https://www.svift.org/ ). Тут заказываю комментарии и отзывы ( https://qcomment.ru/ref/5651 ) для своих сайтов
turovnet
На сайте с 21.04.2010
Offline
23
#3

ТС, у меня похожая проблема с robots.txt.

Почитайте /ru/forum/507277 может что полезное для себя почерпнете.

Звездочка после Disallow: /tag/ действительно лишняя. в WMT Google можно проверить robots.txt на корректность. Там же удалите проиндексированные страницы, которые вам не нужны.

Размещаем пресс-релизы отелей бесплатно, подробнее
root
На сайте с 04.07.2006
Offline
196
#4

спасибо за ответы! исправил, сделал без звездочки.

sirota77
На сайте с 08.09.2008
Offline
161
#5

root, проверяйте нужные урлы в инструментах для вебмастеров.

Роботс проверенный в яндекс вебмастере может работать по другому в гугле.

В рамлере например использование регулярных выражений НЕ ПРЕДУСМОТРЕНО.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий