Карта сайта в robots.txt

12
BigMaK
На сайте с 12.12.2005
Offline
109
2535

Создав карту сайта, необязательно ее прописывать в панель веб-мастера Яндекса. Ее можно указать в файле robots.txt строчкой

sitemap: http://www.site.ru/sitemap.xml

Каков формат, необходимо ли перед этой строчкой писать "User-Agent: *"?

Сервис мгновенного обратного звонка с сайта (http://www.chaser.ru) - увеличивает телефонную конверсию сайта на 20-80%.
2
На сайте с 01.12.2008
Offline
19
#1

Для сайтмапа необязательно указывать юзер агент, так как гугл тоже это понимает. Я лично делаю хитрее стравливаю sitemap.xml, а в роботс прописываю sitemap.xml.gz, и сразу видно когда и кто подцепил... т.е. тогда в яндекс вебмастер висит ссылка от пользователя и ссылка которую нашел робот :)))

WebAlt
На сайте с 02.12.2007
Offline
251
#2

User-agent: *

Disallow: /бла-бла-бла

Allow: /

Sitemap: http://www.сайт.ru/sitemap.xml //(с или без www)//

Host: www.сайт.ru //(с или без www)//

Можно и так

Sitemap: http://www.сайт.ru/папка/sitemap.xml

http://robotstxt.org.ru/

BigMaK
На сайте с 12.12.2005
Offline
109
#3

Спасибо :)

A
На сайте с 12.01.2006
Offline
61
#4
User-agent: *
Disallow: /бла-бла-бла
Allow: /
Sitemap: http://www.сайт.ru/sitemap.xml //(с или без www)//
Host: www.сайт.ru //(с или без www)//

благодарю за инфу

ГЛАВная фарма-партнерка. Удобные аптеки, детальная статистика, высокий конверт! (http://www.glavmed.com/) | 150$ Бонус всем новичкам в ПОКЕРЕ (http://ru.pokerstrategy.com/u1XCQ7) $$$ на дороге (http://www.sape.ru/r.b17970ce21.php)
hcir
На сайте с 28.09.2006
Offline
150
#5

Вообще-то, коль скоро тут раздел яндекса, и если у вас есть отдельная секция для этого поисковика, то сайтмап лучше и удобнее вынести также в отдельную секцию.

Я делаю в таких случаях так:

User-agent: *
(тут директивы)

User-agent: Yandex
(тут директивы)
Host: www.site.ru

Sitemap: http://www.site.ru/sitemap.xml

Собственно говоря, та же структура предлагается в хелпе яндекса (второй пример): http://help.yandex.ru/webmaster/?id=996567#996573

wbr
search bot
На сайте с 29.04.2007
Offline
61
#6

А теперь внимание правильный ответ.

Секции посвященные отдельным ботам идут СВЕРХУ, а не снизу.

Все параметры с новой строки, никаких разбиений, строка-разделитель только между блоками.


User-agent: Yandex
Disallow: /images
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml

User-agent: *
Disallow: /images

Яндекс может писать что угодно, только кроме него это никто больше не прописывал. Ваши сайты посещает куча роботов, имейте совесть, им же читать не удобно.

1) Не тупить целый день на серче. 2) Купить ссылок. 3) Перезвонить Садовскому.
hcir
На сайте с 28.09.2006
Offline
150
#7
search bot:
А теперь внимание правильный ответ.
Секции посвященные отдельным ботам идут СВЕРХУ, а не снизу.

Громко сказано, но по существу неверно. Порядок секций на самом деле не имеет значения, т.к. файл robots.txt анализируется целиком и в случае нахождения подходящей "персональной" секции бот использует её. В противном случае используется общая секция.

search bot:
Яндекс может писать что угодно, только кроме него это никто больше не прописывал.

Ну конечно. Яндекс в хелпе вполне корректные примеры дает, что характерно -- работоспособные.

search bot
На сайте с 29.04.2007
Offline
61
#8

Обратите внимение, там также как и у меня секции идут сверху вниз.

В мануалах Яндекс дает то, что корректно по его мнению. Вы же не будете писать хост или сайтмап для гуглбота. И даже если напишете, конечно, ничего страшного не произойдет, но мы же с Вами грамтоные люди и делаем все правильно, правда?

hcir
На сайте с 28.09.2006
Offline
150
#9
search bot:
Обратите внимение, там также как и у меня секции идут сверху вниз.

Понимаете, это не имеет значения. Что означает: можно ставить впереди секцию яндекса, никто не запрещает. Жесткий порядок имел бы смысл, если бы разбор роботс.тхт прекращался по нахождению первой подходящей секции. Но это не так. Он анализируется посекционно полностью.

search bot:
Вы же не будете писать хост или сайтмап для гуглбота.

Хост не буду, а сайтмап -- вполне. Гугл понимает эту директиву аналогично яндексу. И точно так же можно либо добавить ссылку на свой сайтмап в гугл вебмастер тулз, либо в роботс.тхт (или то и другое вместе).

search bot
На сайте с 29.04.2007
Offline
61
#10
hcir:
понимает эту директиву
Тем не менее, мы рекомендуем отправить файл Sitemap через аккаунт Инструментов для веб-мастеров, чтобы при его обработке не возникло проблем, а также чтобы вы могли получать дополнительную статистику по своему сайту.

Удачи вам в вашиъ начинаниях.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий