robots.txt

A
На сайте с 23.04.2013
Offline
6
404

Добрый день.

Подскажите пожалуйста как правильно закрыть от индексации каталог filter и все, что после него

site.ru/programs/filter/by_country/?countryID=7

в роботс прописано

Disallow: /filter/

но данный url присутствует в индексе

Алексей Барыкин
На сайте с 04.02.2008
Offline
272
#1

Disallow: /programs/filter/

или шаманить с символом *

Dombrov
На сайте с 04.03.2010
Offline
53
#2

Если в индексе яндекса, то должно быть в роботс:

User-Agent: Yandex

Disallow: /programs/filter/

В вебмастере яндекса есть настройка индексирования-Анализ robots.txt

Там ниже список URL можете туда добавить урлы, которые Вы хотите проверить и узнать будут ли они запрещены либо нет.

A
На сайте с 23.04.2013
Offline
6
#3
Алексей Барыкин:
Disallow: /programs/filter/
или шаманить с символом *

Спасибо, т.е. чтобы запретить необходимый каталог нужно указывать к нему предыдущий путь?

---------- Добавлено 12.12.2013 в 12:46 ----------

Dombrov:
Если в индексе яндекса, то должно быть в роботс:
User-Agent: Yandex
Disallow: /programs/filter/

В вебмастере яндекса есть настройка индексирования-Анализ robots.txt
Там ниже список URL можете туда добавить урлы, которые Вы хотите проверить и узнать будут ли они запрещены либо нет.

В индексе гугла

Daftix
На сайте с 26.11.2006
Offline
117
#4

И так должно работать.

Если речь идет о Гугла, то не парьтесь — он во многом игнорирует роботс.тхт

MATRAS.RU (https://www.matras.ru/) — интернет-магазин матрасов и товаров для сна
A
На сайте с 23.04.2013
Offline
6
#5
Daftix:
И так должно работать.

Если речь идет о Гугла, то не парьтесь — он во многом игнорирует роботс.тхт

А что же делать если необходимая мне страница не индексируется, а это чудо в индексе? :)

Daftix
На сайте с 26.11.2006
Offline
117
#6
Alx_:
А что же делать если необходимая мне страница не индексируется, а это чудо в индексе? :)

Есть очень простой способ: попробуйте удалить страницу в пенели вебмастера Яндекса. Если роботс написан НЕправильно, то вы получите сообщение, что нет оснований для удаления.

Dombrov
На сайте с 04.03.2010
Offline
53
#7

От самого гугла:

"Файл robots.txt не является обязательным к исполнению"

https://support.google.com/webmasters/answer/156449?hl=ru

И там же ниже он говорит о том. что для исключения страницы используйте метататег noindex. При этом в роботсе запрет на эту страницу не должен стоять.

Константин Валентинович
На сайте с 23.11.2013
Offline
64
#8
Alx_:
Добрый день.
Подскажите пожалуйста как правильно закрыть от индексации каталог filter и все, что после него
site.ru/programs/filter/by_country/?countryID=7

в роботс прописано

Disallow: /filter/

но данный url присутствует в индексе

Если надо гарантировано, то положите в эту папку файлик .htaccess со следующим содержанием:

deny from all

Доступ в эту папку будет для всех закрыт:)

A
На сайте с 23.04.2013
Offline
6
#9
Dombrov:
От самого гугла:
"Файл robots.txt не является обязательным к исполнению"
https://support.google.com/webmasters/answer/156449?hl=ru

И там же ниже он говорит о том. что для исключения страницы используйте метататег noindex. При этом в роботсе запрет на эту страницу не должен стоять.

Но это не страница, а результат поиска

---------- Добавлено 12.12.2013 в 13:39 ----------

Константин Валентинович:
Если надо гарантировано, то положите в эту папку файлик .htaccess со следующим содержанием:
deny from all
Доступ в эту папку будет для всех закрыт:)

А в таком случае даная страница будет закрыта так же для пользователей? :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий