Опять про robots.txt

12 3
mickle
На сайте с 11.01.2006
Offline
115
1340

Объясните пожалуйста, что значит часто встречающаяся конструкция

User-agent: *

Disallow: /?

И еще: частенько встречается такое:

Disallow: /bitrix/ 

Disallow: /admin/
Disallow: /pbc_download/

Чем это отличается от

Disallow: /bitrix

Disallow: /admin
Disallow: /pbc_download

Спасибо!

Дистанционные курсы английского языка ( http://www.OpenRazum.ru ) DMOZ: Образовательное ПО ( http://www.dmoz.org/World/Russian/Компьютеры/Программное_обеспечение/Образовательное/ )
Olya
На сайте с 03.12.2003
Offline
120
#1
mickle:
Объясните пожалуйста, что значит часто встречающаяся конструкция

User-agent: *

Disallow: /?


Будут закрыты все страницы сайта начинающиеся со ?

mickle:
И еще: частенько встречается такое:

Disallow: /bitrix/ 

Disallow: /admin/
Disallow: /pbc_download/


Чем это отличается от
Disallow: /bitrix

Disallow: /admin
Disallow: /pbc_download


Спасибо!

В первом случае будут закрыты страницы типа _site.ru/bitrix/1, _site.ru/bitrix/2 и т.д., а во втором могут быть закрыты и страницы типа _site.ru/bitrixxxx, _site.ru/bitrixghdjkghjk

по сути - у кого как переводится в статику (со / в конце или без него), тот те страницы и закрывает

Диол :)
BigMaK
На сайте с 12.12.2005
Offline
109
#2
Olya:
Будут закрыты все страницы сайта начинающиеся со ?

А по-моему будет закрывать все динамические страницы типа index?param=1 и т.д...

Сервис мгновенного обратного звонка с сайта (http://www.chaser.ru) - увеличивает телефонную конверсию сайта на 20-80%.
Olya
На сайте с 03.12.2003
Offline
120
#3
BigMaK:
А по-моему будет закрывать все динамические страницы типа index?param=1 и т.д...

Проверьте, я только что на всякий случай проверила - страницы через форму удаления на яндексе не удаляются с такой конструкцией в роботе, так что Ваше мнение ошибочно.

BigMaK
На сайте с 12.12.2005
Offline
109
#4
Olya:
Проверьте, я только что на всякий случай проверила - страницы через форму удаления на яндексе не удаляются с такой конструкцией в роботе, так что Ваше мнение ошибочно.

Все. Понял. Вы правы )

asdfqwer
На сайте с 09.07.2006
Offline
26
#5
Olya:
Проверьте, я только что на всякий случай проверила - страницы через форму удаления на яндексе не удаляются с такой конструкцией в роботе, так что Ваше мнение ошибочно.

Тогда приведите пжалста пример страницы, которая будет закрыта...

Junior
На сайте с 19.04.2005
Offline
58
#6
Olya:
Проверьте, я только что на всякий случай проверила - страницы через форму удаления на яндексе не удаляются с такой конструкцией в роботе, так что Ваше мнение ошибочно.

За чем гадать? Берем документуху в переводе и читаем:

Стандарт исключений для роботов (robots.txt)

и по теме:

Несколько слов о том, как работают роботы (spiders) поисковых машин.

и не забываем, что теоретически возможны проблемы

Труженик КП, ТЗ и ИА
asdfqwer
На сайте с 09.07.2006
Offline
26
#7

а вот такой вопрос еще возник: у кого приоритет выше, у robots.txt или у мета-тега robots?

где-то читал, что вроде у тега... хотя хочется услышать разные мнения

Junior
На сайте с 19.04.2005
Offline
58
#8
asdfqwer:
а вот такой вопрос еще возник: у кого приоритет выше, у robots.txt или у мета-тега robots?
где-то читал, что вроде у тега... хотя хочется услышать разные мнения

Теги только дополняют robots.txt, они не могут его перекрыть.

Например, у вас закрыт урл /admin/ в robots.txt, тогда робот просто не дойдет до тегов файлов в этом урле, т.к. не будет скачивать эту страницу (т.е. не должен индексировать, скачивать-то он может всё, что открыто). Если запрета в robots.txt нет, тогда робот смотрит на мета-теги. Если в них нет, тогда смотрит на дополнительные теги и атрибуты (тег noindex или атрибут rel="nofollow"). ;)

asdfqwer
На сайте с 09.07.2006
Offline
26
#9

пасиб.🚬

Стрела
На сайте с 18.04.2006
Offline
109
#10

Будьте добры, чтоб новую тему не открывать - подскажите..

У меня проблема с роботсом.

Присутствует ошибка . Об этом узнала из проверки сервисом dinews.ru/seo. Конкретнее :"Ошибка! robots.txt содержит html теги! "

На главной у меня строка кода <meta name="robots" content="index,follow">

В корневой директории прописан robots.txt -

User-agent: *

Disallow:

Host: www.texmash.ru

Что может быть не так???

Жизнь диктует, я записываю (http://textrunet.ru/)
12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий