Все вопросы по robots.txt

avtomastersu
На сайте с 25.12.2010
Offline
92
#31
Dombrov:
По вопросам robots.txt отдельный топик, поэтому продолжение из данной закрытой темы /ru/forum/827897
Сообщение от Dombrov Посмотреть сообщение
Может вот так?
Disallow: /*2*/
allow: /*2*-*/

Первый запрещает все с цифрой два. А второй разрешает из них если стоит -. Если исходить из вашей структуры то /число/ старые страницы, а новые могут быть /число-/, а такие как раз разрешаем.

avtomastersu: Спасибо, очень интересное предложение. А не существует правила, одного для всех цифр, что бы не вставлять 2, 5, 78 и т. д., много их там таких.
Или так нельзя?

Для всех не знаю, но достаточно до 9.
Disallow: /*1*/
allow: /*1*-*/
Disallow: /*2*/
allow: /*2*-*/
Disallow: /*3*/
allow: /*3*-*/
и так далее до 9 и все. Указывать двухзначные числа или трехзначные не надо. Он ищет символ, например 2, и находит его как в 250 так и 320.

Нигде не мог решить. Спасибо Dombrov, все сработало.

Добавить ориг. статью, сайт, объявление в katalogclub.com (https://katalogclub.com)
sisers
На сайте с 19.12.2005
Offline
83
#32

Нужно запретить индексацию внутри каталога, но чтобы индексировалась главная страница.

Т.е. domen.ru/category/ должна индексироваться

А domen.ru/category/tovar1/, domen.ru/category/tovar2/ и т.п. запретить к индексации.

Как это правильно прописать в robots.txt?

У меня есть тайное знание. А у Вас??? Интернет маркетинг (http://yabs.ru)
H
На сайте с 25.12.2013
Offline
4
#33

Disallow: /category/tovar

при этом если вы хотите, чтобы например /category/tovar123.php индексировался, то такой пример не пройдет.

Ripro
На сайте с 04.11.2006
Offline
144
#34

sisers, Категории нужно продвигать, а не закрывать от индексации

H
На сайте с 25.12.2013
Offline
4
#35

Ripro, ну может у него cms кучу дублей делает :)

sisers, только учтите, что иногда поисковики кладут болт на disallow.

Linara
На сайте с 20.11.2010
Offline
31
#36

они просто делают свое черное дело! Информация правит миром и не важно как при этом добыта.

Ручное размещение статей в каталогах по вашей цене.
Yuto
На сайте с 24.12.2009
Offline
37
#37

Здравствуйте, форумчане.

Я совсем запутался читая мануалы Яндекса и Google о том, как правильно составить свой robots.txt

Меня интересует не совсем стандартный вопрос, с основами robots все ясно, а вот как быть если:

1. Я хочу заблокировать раздел http://vorota-style.ru/vorota/ и все что заканчивается после /vorota/ЛЮБОЙ РАЗДЕЛ/, например, /vorota/ЛЮБОЙ РАЗДЕЛ/dd.

2. Но при этом мне нужны все разделы (выдели жирным) /vorota/ЛЮБОЙ РАЗДЕЛ/

Подскажите как быть, очень нужна ваша помощь, а то Яша иногда индексирует такие страницы, как, например, /vorota/ЛЮБОЙ РАЗДЕЛ/dd, причем она идентична http://vorota-style.ru/vorota/

Web-студия Seven Portal (http://7portal.ru) - продвижение и создание сайтов, поддержка, SEO-оптимизация сайта. Дополнительные услуги: полиграфия и создание фирменного стиля.
аrmagedon
На сайте с 01.07.2009
Offline
105
#38

В Яндекс.вебмастере есть инструмент проверки роботса, если в чем-то сомневаетесь - юзайте его.

Disallow: */vorota/* - выплюнет из индекса всё, содержащее в своем URL /vorota/

если просто Disallow: /vorota/ - тогда ваш_сайт/vorota/ и все вложенные каталоги и страницы будут запрещены.

Вообще читайте http://help.yandex.ru/webmaster/controlling-robot/robots-txt.xml тут инфы с головой!

Yuto
На сайте с 24.12.2009
Offline
37
#39
аrmagedon:
Вообще читайте http://help.yandex.ru/webmaster/controlling-robot/robots-txt.xml тут инфы с головой!

прочел весь и только после сюда обратился, т.к. нет именно моего случая и методом тыка не получается.

---------- Добавлено 30.12.2013 в 04:36 ----------

аrmagedon:
В Яндекс.вебмастере есть инструмент проверки роботса, если в чем-то сомневаетесь - юзайте его.
Он показывает 1...25, когда загружал файл. И все... ничего более...
-S
На сайте с 10.12.2006
Online
Модератор1354
#40

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий