Нужно посоветоваться по disalow в robots.txt

12
E
На сайте с 14.01.2013
Offline
0
833

Как сделать так что бы например страница www.asdf.ru/zhenskaya_obuv/ была индексируема, а например такие страницы как www.asdf.ru/zhenskaya_obuv/asdf/ или www.asdf.ru/zhenskaya_obuv/asdf/fdsa закрыты из индекса?

Знаю вопрос как бы легкий, и я кажется знаю как это делается, но нужно перепровериться, а то я очкую с этим robots-ом как улетит пол сайта в ноиндекс... :crazy:

---------- Добавлено 14.01.2013 в 15:16 ----------

Просто меня смущает то что пишет гугл на своей странице

"Чтобы заблокировать каталог и все его содержание, введите название каталога и косую черту.

Disallow: /nenuzhnyj-katalog/"

Соответственно мне приходит на ум только одно:

Disallow: /zhenskaya_obuv/*

Непонятно как это воспринимают роботы, * это значит что после /zhenskaya_obuv/ обязательно что то будет, и это не индексировать. Или же * может подразумевать что ничего может и не быть... тогда и сам каталог закроется от индексации... и что тогда?

Аllow: /zhenskaya_obuv/ и тогда я снова разблокирую каталог и все его содержание...

Че делать?

angrycrucian
На сайте с 13.12.2012
Offline
18
#1

Я так понимаю нужно запретить индексировать страницы типа

www.asdf.ru/zhenskaya_obuv/asdf/fdsa

www.asdf.ru/zhenskaya_obuv/asdf/

но сама страница www.asdf.ru/zhenskaya_obuv/ индексироваться должна? Если да то поможет:

Disallow: /asdf/

Это запретит индексировать все адреса в которые содержат выражение /asdf/

Aven
На сайте с 16.09.2006
Offline
134
#2

вот здесь пример отличный - http://www.google.com/robots.txt

* означает именно то, что тебе надо

варианты типа


Disallow: /compare/*/apply*
Disallow: /baraza/*/search
Disallow: /baraza/*/report
Помогаю по мере возможности :)
siv1987
На сайте с 02.04.2009
Offline
427
#3

Disallow: /*/asdf/

запретит все страницы любого уровня вложенности, которые содержат /asdf/

Sheens
На сайте с 01.01.2008
Offline
68
#4

robots.txt

User-agent: *

Allow: /zhenskaya_obuv/$
Disallow: /zhenskaya_obuv/

У Яндекса и Гугла есть инструменты проверки синтаксиса

http://webmaster.yandex.ru/robots.xml

У Гугла после добавления сайта в google.com/webmasters

Ещё как вариант, использовать на тех страницах, что должны быть запрещены к индексации

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Gosha5767
На сайте с 13.01.2013
Offline
8
#5

У меня на сайте: http://www.sitedelkinm.ru пропала индексация некоторых страниц,

в файле robots поставил disalow/*, то есть звездочку. Потом убрал ее.

Вопрос появяться ли страницы, которые были запрещены в индексе, и что нужно сделать для индексации случайно запрещенных страниц?

Помогу создать сайт на Joomla (http://sitedelkin.ru/sozdanie-sajta-joomla-2-5.html)
kimberlit
На сайте с 13.03.2007
Offline
370
#6
Gosha5767:
поставил disalow/*

Это что было?

Sheens
На сайте с 01.01.2008
Offline
68
#7
Gosha5767:
в файле robots поставил disalow/*, то есть звездочку. Потом убрал ее.

Если

disalow/*
часть URL, то могу сказать, что disalow/* и disalow/ - одинаковы по сути, то есть, ничего не изменится.

Напишите, какие разделы хотите закрыть, а какие - оставить открытыми для индексации

kimberlit:
Это что было?

Это рецепт, как избавить себя от мук SEO, выкинув сайт из индекса :)

kimberlit
На сайте с 13.03.2007
Offline
370
#8
Sheens:
то могу сказать, что disalow/* и disalow/ - одинаковы по сути, то есть, ничего не изменится.
Sheens:
Это рецепт, как избавить себя от мук SEO, выкинув сайт из индекса

Одноклассник что ли? Что это за набор символов?

Sheens
На сайте с 01.01.2008
Offline
68
#9
kimberlit:
Одноклассник что ли? Что это за набор символов?

Насчёт второго - попытка пошутить) Понятия не имею, что подразумевалось под этими символами

А что насчёт первого - скажете, что

Disallow: /url/
и
Disallow: /url/*
не одно и то же?
kimberlit
На сайте с 13.03.2007
Offline
370
#10
Sheens:
не одно и то же?

Одно.

Sheens:
disalow/* и disalow/

А это что?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий