- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Создав карту сайта, необязательно ее прописывать в панель веб-мастера Яндекса. Ее можно указать в файле robots.txt строчкой
sitemap: http://www.site.ru/sitemap.xml
Каков формат, необходимо ли перед этой строчкой писать "User-Agent: *"?
Для сайтмапа необязательно указывать юзер агент, так как гугл тоже это понимает. Я лично делаю хитрее стравливаю sitemap.xml, а в роботс прописываю sitemap.xml.gz, и сразу видно когда и кто подцепил... т.е. тогда в яндекс вебмастер висит ссылка от пользователя и ссылка которую нашел робот :)))
User-agent: *
Disallow: /бла-бла-бла
Allow: /
Sitemap: http://www.сайт.ru/sitemap.xml //(с или без www)//
Host: www.сайт.ru //(с или без www)//
Можно и так
Sitemap: http://www.сайт.ru/папка/sitemap.xml
http://robotstxt.org.ru/
Спасибо :)
Disallow: /бла-бла-бла
Allow: /
Sitemap: http://www.сайт.ru/sitemap.xml //(с или без www)//
Host: www.сайт.ru //(с или без www)//
благодарю за инфу
Вообще-то, коль скоро тут раздел яндекса, и если у вас есть отдельная секция для этого поисковика, то сайтмап лучше и удобнее вынести также в отдельную секцию.
Я делаю в таких случаях так:
(тут директивы)
User-agent: Yandex
(тут директивы)
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml
Собственно говоря, та же структура предлагается в хелпе яндекса (второй пример): http://help.yandex.ru/webmaster/?id=996567#996573
А теперь внимание правильный ответ.
Секции посвященные отдельным ботам идут СВЕРХУ, а не снизу.
Все параметры с новой строки, никаких разбиений, строка-разделитель только между блоками.
User-agent: Yandex
Disallow: /images
Host: www.site.ru
Sitemap: http://www.site.ru/sitemap.xml
User-agent: *
Disallow: /images
Яндекс может писать что угодно, только кроме него это никто больше не прописывал. Ваши сайты посещает куча роботов, имейте совесть, им же читать не удобно.
А теперь внимание правильный ответ.
Секции посвященные отдельным ботам идут СВЕРХУ, а не снизу.
Громко сказано, но по существу неверно. Порядок секций на самом деле не имеет значения, т.к. файл robots.txt анализируется целиком и в случае нахождения подходящей "персональной" секции бот использует её. В противном случае используется общая секция.
Яндекс может писать что угодно, только кроме него это никто больше не прописывал.
Ну конечно. Яндекс в хелпе вполне корректные примеры дает, что характерно -- работоспособные.
Обратите внимение, там также как и у меня секции идут сверху вниз.
В мануалах Яндекс дает то, что корректно по его мнению. Вы же не будете писать хост или сайтмап для гуглбота. И даже если напишете, конечно, ничего страшного не произойдет, но мы же с Вами грамтоные люди и делаем все правильно, правда?
Обратите внимение, там также как и у меня секции идут сверху вниз.
Понимаете, это не имеет значения. Что означает: можно ставить впереди секцию яндекса, никто не запрещает. Жесткий порядок имел бы смысл, если бы разбор роботс.тхт прекращался по нахождению первой подходящей секции. Но это не так. Он анализируется посекционно полностью.
Вы же не будете писать хост или сайтмап для гуглбота.
Хост не буду, а сайтмап -- вполне. Гугл понимает эту директиву аналогично яндексу. И точно так же можно либо добавить ссылку на свой сайтмап в гугл вебмастер тулз, либо в роботс.тхт (или то и другое вместе).
понимает эту директиву
Удачи вам в вашиъ начинаниях.