Помогите разобраться с robots.txt

123
K
На сайте с 31.01.2001
Offline
737
#11

Allow: index.php

Allow: contact.php

Эти две строки бессмысленны, они никогда не сработают. Все урлы начинаются со слеша / .

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
Megamozg
На сайте с 25.09.2006
Offline
147
#12
ListOn:
В данном случае ничего не изменится.
Просто раньше в таком варианте:

Disallow: */search/
Allow: /search/map.php$
Allow: /search/$
Disallow: /bitrix/

были бы запрещены для индексации все категории search, а по новым правилам, такой порядок директив будет обрабатываться также, как и указанный вами вариант. То есть первыми будут обрабатываться директивы для более "коротких" URL, независимо от того, в какой последовательности эти директивы будут прописаны.

В приведенном вами примере я вообще не вижу логики. Чем надо руководствоваться, чтобы вставлять директивы Allow между или после директив Disallow?

Раньше у меня при составлении файлов была примерно такая логика:

  • закрываем все разделы, которые не должны индексироваться;
  • составляем список директив Disallow;
  • находим в них подразделы, которые являются исключениями и должны попасть в индекс;
  • составляем список директив Allow.

Т.к. директивы Allow всегда являются исключениями из директив Disallow, они всегда должны стоять выше и обрабатываться первыми.

Пожалуйста покажите на ваших конкретных примерах файлов и урлов - что поменялось?

Не надо курить много китайской травы...
Linux
На сайте с 04.12.2008
Offline
210
#13
nik_kent:
Проверьте здесь - http://webmaster.yandex.ru/robots.xml
www.главная.ru запрещена.
Нужно еще: Allow: /

Если Allow: /

а потом Disallow: /

То смысла нет....😒

Может вот так сделать:

User-agent: Yandex

Allow: /

Allow: /index.php

Allow: /contact.php

Disallow: /*

Kost:
Allow: index.php
Allow: contact.php

Эти две строки бессмысленны, они никогда не сработают. Все урлы начинаются со слеша / .

Да да, спасибо, это просто невнимательность.

Личный VPN и Socks 5 прокси всего за 5 баксов в месяц! (https://clck.ru/Hp6Gk) Настройка Яндекс Директ и Google Adwords под ключ!
Megamozg
На сайте с 25.09.2006
Offline
147
#14

Linux,

User-agent: *

Allow: /$

Allow: /contacts.php$

Disallow: /

Если только для Яндекса, то пропишите в юзер агенте Yandex. Не забудьте хост и путь к *.xml карте сайта написать.

Можно воспользоваться анализатором http://webmaster.yandex.ru/site/robots.xml

В гугл вебмастере есть аналогичный инструмент.

Мой изначальный вопрос все еще актуален! ;)

Linux
На сайте с 04.12.2008
Offline
210
#15
Megamozg:
Linux,

User-agent: *
Allow: /$
Allow: /contacts.php$
Disallow: /

Если только для Яндекса, то пропишите в юзер агенте Yandex. Не забудьте хост и путь к *.xml карте сайта написать.
Можно воспользоваться анализатором http://webmaster.yandex.ru/site/robots.xml
В гугл вебмастере есть аналогичный инструмент.

Мой изначальный вопрос все еще актуален! ;)

Большое спасибо,

а вот так как я написал не получится? просто самому интересно :)

User-agent: Yandex

Allow: /

Allow: /index.php

Allow: /contact.php

Disallow: /*

Megamozg
На сайте с 25.09.2006
Offline
147
#16
Linux:
Большое спасибо,
а вот так как я написал не получится? просто самому интересно :)
User-agent: Yandex
Allow: /
Allow: /index.php
Allow: /contact.php
Disallow: /*

Так, как вы написали не получится.

Linux
На сайте с 04.12.2008
Offline
210
#17
Megamozg:
Так, как вы написали не получится.

Почему не получится?

А так, как вы написали, для гугла работает тоже ?

User-agent: *
Allow: /$
Allow: /contacts.php$
Disallow: /
R
На сайте с 18.10.2009
Offline
33
#18
Linux:
Почему не получится?

Потому что Яндекс по умолчанию ко всем дерективам добавляет *

т.е. Allow: / и Allow: /* в глазах робота Яши, одно и то же, а вот символ $ ставит все на свои места.

Megamozg
На сайте с 25.09.2006
Offline
147
#19
Linux:
Почему не получится?

А так, как вы написали, для гугла работает тоже ?

Для гугла тоже будет работать!

Ваш вариант неправильный по нескольким причинам.

1. Знак * дописывается ко всем урлам, где нет знака $, т.е. / и /* одно и то же.

2. Индексировать главную страницу по двум урлам / и /index.php неправильно

3. В конец урлов, в вашем случае, надо ставить знак $ иначе откроете для индексации весь мусор, типа /contacts.php?utm_source=xxx&utm_medium=xxxx ну и т.д. (выше в этом же топике про подобные проблемы кто-то уже упоминал)

LO
На сайте с 13.12.2010
Offline
12
#20
Megamozg:
В приведенном вами примере я вообще не вижу логики. Чем надо руководствоваться, чтобы вставлять директивы Allow между или после директив Disallow?

В том-то и фишка, что очередность написания директив теперь не будет иметь смысла - их обработка будет зависеть от длины префикса URL. В примере, я лишь указал, что порядок директив теперь не играет роли. Это и является международным стандартом, к которому стремится Яндекс.

ListOn добавил 13.10.2011 в 17:47

Ну, пример из блога Яндекса же:

User-agent: Yandex

Disallow: /

Allow: /catalog

По старым правилам обработки для индексации запрещен весь сайт, по новым - весь, кроме /catalog

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий