- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Т.к. не сильна в этом вопросе, прошу вашей помощи. Подскажите:
1. Зачем в строке Disallow: ставят *? Например Disallow: */catalog/1.htm. Что это означает? И что в итоге это закрывает?
2. Если я закрываю от индексации главную страницу каталога
Disallow: /catalog/
то как я понимаю, от индексации закроются и все страницы в самом каталоге, такие как /catalog/1.htm и т.п.?
3. Если мое предположение по поводу п.2 верно, то как верно закрыть от индексации главную страницу каталога вида www.site.by/catalog/, не навредив остальным страницам в этом каталоге?
Спасибо за помощь!
то как верно закрыть от индексации главную страницу каталога вида www.site.by/catalog/, не навредив остальным страницам в этом каталоге?
Спасибо за помощь!
Disallow: /catalog/$
1. * ставится, так как адрес каталога может быть не только site.by/catalog/, но и site.by/что-то еще/catalog/1.htm. В случае Disallow: */catalog/1.htm закроются все страницы, содержащие в своем url /catalog/. А в случае Disallow: /catalog/ страница site.by/что-то еще/catalog/1.htm будет проиндексирована.
2. Да
3. Согласен с semenov
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Sitemap: http://bma.ua/index.php?option=com_xmap&sitemap=1&view=xml
подскажите чтоб лучше индексировалось может убрать:
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
8e3yn4ik, разве что-то не индексируется? robots.txt корректный, правда нужно прописать еще и директиву Host.
И советую удалить папку /installation/, на большинстве движков это нужно делать, т.к. в некоторых случаях можно снова инициализировать процесс установки.
8e3yn4ik, Джумла? Картинки по умолчанию вроде кладутся в директорию /images/, которая у Вас закрыта от индексации. Лучше открыть, ИМХО.
да джумла, открыл /images/ , а еще Disallow: /templates/ там же хранятся шаблоны, мб тоже нужно открыть?
User-agent: *
Disallow: /administrator/
Disallow: /components/
Disallow: /cache/
Disallow: /includes/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /*component
Disallow: /*pechat.html
Disallow: /*?
Crawl-delay: 0.5
Host: www.site.ru
sitemap: http://www.site.ru/sitemapxml
User-agent: Yandex
Disallow: /administrator/
Disallow: /components/
Disallow: /cache/
Disallow: /includes/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /*component
Disallow: /*pechat.html
Disallow: /Tablica/*
Disallow: /*Pechat.html
Disallow: /index2.php?option=com_content
Disallow: /*feed/atom/
Disallow: /*rss.html
Disallow: /*atom.html
Disallow: /*feed/rss/
Disallow: /*?
Clean-param: frontPageAdsCount&lang&Itemid&option&view&limit&month&year&cat_id&fuck&FontSize
Crawl-delay: 0.5
Host: www.site.ru
sitemap: http://www.site.ru/sitemapxml
niceteam добавил 09.11.2010 в 10:47
вот мой роботс для joomla, может кому пригодится.
демс, как чужой роботс может кому-то пригодится, разделы у всех разные и нада под каждый свой писать
8e3yn4ik, В Host проверьте как проиндексирован сайт с www или без.
ну и согласен с niceteam - сделать для Яндекса отдельные параметры User-agent: Yandex
демс, как чужой роботс может кому-то пригодится, разделы у всех разные и нада под каждый свой писать
На одинаковых CMS служебные страницы, которые индексировать не надо - одинаковы ;)
albion добавил 10.11.2010 в 12:34
niceteam, директиву хост, вроде как понимает только Яндекс.