Вопрос по robots.txt

12
Ольга Деева
На сайте с 14.10.2008
Offline
141
1287

Т.к. не сильна в этом вопросе, прошу вашей помощи. Подскажите:

1. Зачем в строке Disallow: ставят *? Например Disallow: */catalog/1.htm. Что это означает? И что в итоге это закрывает?

2. Если я закрываю от индексации главную страницу каталога

Disallow: /catalog/

то как я понимаю, от индексации закроются и все страницы в самом каталоге, такие как /catalog/1.htm и т.п.?

3. Если мое предположение по поводу п.2 верно, то как верно закрыть от индексации главную страницу каталога вида www.site.by/catalog/, не навредив остальным страницам в этом каталоге?

Спасибо за помощь!

S
На сайте с 28.10.2005
Offline
296
#1
sherry:
то как верно закрыть от индексации главную страницу каталога вида www.site.by/catalog/, не навредив остальным страницам в этом каталоге?
Спасибо за помощь!

Disallow: /catalog/$

[Удален]
#2

1. * ставится, так как адрес каталога может быть не только site.by/catalog/, но и site.by/что-то еще/catalog/1.htm. В случае Disallow: */catalog/1.htm закроются все страницы, содержащие в своем url /catalog/. А в случае Disallow: /catalog/ страница site.by/что-то еще/catalog/1.htm будет проиндексирована.

2. Да

3. Согласен с semenov

83
На сайте с 08.11.2010
Offline
4
#3

User-agent: *

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Sitemap: http://bma.ua/index.php?option=com_xmap&sitemap=1&view=xml

подскажите чтоб лучше индексировалось может убрать:

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Научитесь играть в покер, не вкладывая собственных денег! Получите бонус в $50 от PokerStrategy.com! (http://ru.pokerstrategy.com/#uPN97T)
Shapranov Pavel
На сайте с 27.08.2007
Offline
304
#4

8e3yn4ik, разве что-то не индексируется? robots.txt корректный, правда нужно прописать еще и директиву Host.

И советую удалить папку /installation/, на большинстве движков это нужно делать, т.к. в некоторых случаях можно снова инициализировать процесс установки.

[Удален]
#5

8e3yn4ik, Джумла? Картинки по умолчанию вроде кладутся в директорию /images/, которая у Вас закрыта от индексации. Лучше открыть, ИМХО.

83
На сайте с 08.11.2010
Offline
4
#6

да джумла, открыл /images/ , а еще Disallow: /templates/ там же хранятся шаблоны, мб тоже нужно открыть?

niceteam
На сайте с 20.02.2009
Offline
55
#7

User-agent: *

Disallow: /administrator/

Disallow: /components/

Disallow: /cache/

Disallow: /includes/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Disallow: /*component

Disallow: /*pechat.html

Disallow: /*?

Crawl-delay: 0.5

Host: www.site.ru

sitemap: http://www.site.ru/sitemapxml

User-agent: Yandex

Disallow: /administrator/

Disallow: /components/

Disallow: /cache/

Disallow: /includes/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Disallow: /*component

Disallow: /*pechat.html

Disallow: /Tablica/*

Disallow: /*Pechat.html

Disallow: /index2.php?option=com_content

Disallow: /*feed/atom/

Disallow: /*rss.html

Disallow: /*atom.html

Disallow: /*feed/rss/

Disallow: /*?

Clean-param: frontPageAdsCount&lang&Itemid&option&view&limit&month&year&cat_id&fuck&FontSize

Crawl-delay: 0.5

Host: www.site.ru

sitemap: http://www.site.ru/sitemapxml

niceteam добавил 09.11.2010 в 10:47

вот мой роботс для joomla, может кому пригодится.

83
На сайте с 08.11.2010
Offline
4
#8

демс, как чужой роботс может кому-то пригодится, разделы у всех разные и нада под каждый свой писать

Vicious_Kiss
На сайте с 25.06.2008
Offline
24
#9

8e3yn4ik, В Host проверьте как проиндексирован сайт с www или без.

ну и согласен с niceteam - сделать для Яндекса отдельные параметры User-agent: Yandex

albion
На сайте с 07.10.2005
Offline
247
#10
8e3yn4ik:
демс, как чужой роботс может кому-то пригодится, разделы у всех разные и нада под каждый свой писать

На одинаковых CMS служебные страницы, которые индексировать не надо - одинаковы ;)

albion добавил 10.11.2010 в 12:34

niceteam, директиву хост, вроде как понимает только Яндекс.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий