robot.txt

12 3
Z
На сайте с 08.05.2013
Offline
24
1495

Сомневаюсь в правильности своего robot.txt

Подскажите, пожалуйста.

User-agent: *

Disallow: /news/
Disallow: /search/

User-agent: Yandex
Disallow: /news/
Disallow: /search/
Host: site.ru

Это получается, что для роботов запрещены news и search для всех, кроме Яндекса?

zomorg
На сайте с 04.02.2009
Offline
191
#1
z1odey:
Сомневаюсь в правильности своего robot.txt

Подскажите, пожалуйста.

User-agent: *

Disallow: /news/
Disallow: /search/

User-agent: Yandex
Disallow: /news/
Disallow: /search/
Host: site.ru


Это получается, что для роботов запрещены news и search для всех, кроме Яндекса?

Для всех, и особенно для яндекса...

Z
На сайте с 08.05.2013
Offline
24
#2

А для чего такие уточнения?

Т.е. указание для всех недостаточно?

И, пожалуйста, уточните, для чего поле Host:

kimberlit
На сайте с 13.03.2007
Offline
370
#3

z1odey, набери в яндексе слово robots.txt и будешь приятно удивлён.

zomorg
На сайте с 04.02.2009
Offline
191
#4
z1odey:
А для чего такие уточнения?

Т.е. указание для всех недостаточно?

И, пожалуйста, уточните, для чего поле Host:

Возможно для всех и достаточно... Но Яндекс хочет, чтоб его роботов была отдельная инструкция...

http://help.yandex.ru/webmaster/?id=996567 - вот тут почитайте... и Про хост там же...

Z
На сайте с 08.05.2013
Offline
24
#5

Спасибо.

Важно: если такой робот скачивает документ, не доступный основному роботу Яндекса, этот документ никогда не будет проиндексирован и не попадет в поисковую выдачу.

Список роботов Яндекса, не следующих общим запрещающим правилам в robots.txt:

YandexDirect скачивает целевые страницы рекламных объявлений для проверки их доступности и уточнения тематики, что необходимо для их размещения в поисковой выдаче и на сайтах-партнерах;
YandexCalendar регулярно скачивает файлы календарей по инициативе живых пользователей, которые часто располагаются в запрещенных для индексации каталогах.

Если вас не устраивает данное поведение, можно ограничить им доступ к своему сайту или его части с помощью директив специально для них, например:

Т.е. в моем примере, робот YandexDirect, например, все равно имеет доступ ?

А
На сайте с 31.03.2013
Offline
23
#6

Можно проверить в Яндекс.Вебмастере как он видит инструкцию. http://webmaster.yandex.ru/site/robots.xml

zomorg
На сайте с 04.02.2009
Offline
191
#7

Для каждого из них также действительно правило: если обнаружены директивы для конкретного робота, директивы 'User-agent: Yandex' и 'User-agent: *' не используются.

'User-agent: Yandex' - применимо для всех...

vold57
На сайте с 01.10.2007
Offline
261
#8
kimberlit:
z1odey, набери в яндексе слово robots.txt и будешь приятно удивлён.

Заодно будешь знать как правильно называется этот файл.

Аудит сайтов - главная часть это тщательная ручная работа, а не отчеты сервисов и программ (https://vold57.com/audit). Продвижение сайтов (https://vold57.com/seo)
Elfiec
На сайте с 26.12.2006
Offline
53
#9

файл называется robots.txt

чтобы разрешить яндексу используется Allow:

здесь подробности http://help.yandex.ru/webmaster/?id=996567

вебмастер
L
На сайте с 10.05.2013
Offline
0
#10

Чтобы не создавать новой темы, хочу спросить здесь. Есть файл роботс, но после аудита сайта мне написали, что в нем неверные команды.

Посмотрите пожалуйста этот файл и скажите - что не так:

User-agent: Yandex

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /wp-trackback

Disallow: /wp-feed

Disallow: /wp-comments

Disallow: */trackback

Disallow: */feed

Disallow: */comments

Host: www.mali-business.ru

User-agent: *

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /wp-trackback

Disallow: /wp-feed

Disallow: /wp-comments

Disallow: */trackback

Disallow: */feed

Disallow: */comments

Sitemap: http://mali-business.ru/karta-sajta

Заранее благодара!

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий