Зеркала

[Удален]
472

Простите за повтор,эта тема уже рассматривалась

Просто хочу уточнить

правильно составлен роботс?

Я хочу чтобы яндекс основным считал этот сайт без www

User-agent: Yandex

Disallow: /cgi-bin/

Host: tyui.ru

User-agent: *

Disallow: /cgi-bin/

Disallow: /admin/

Disallow: /classes/

Disallow: /modules/

Disallow: /editor/

Disallow: /help/

Disallow: /templates/

kimberlit
На сайте с 13.03.2007
Offline
370
#1

Неправильно. Между секциями должна быть пустая строка.

User-agent: Yandex
Disallow: /cgi-bin/
Host: tyui.ru

User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /classes/
Disallow: /modules/
Disallow: /editor/
Disallow: /help/
Disallow: /templates/

Yeugeny
На сайте с 01.02.2008
Offline
42
#2

Одного никак не пойму, нафига делать в роботсе отдельный блок под Яндекс, если блоки отличаются только записью Host. По-крайней мере, сам Яндекс говорит так http://help.yandex.ru/webmaster/?id=996567#996574:

Директива Host.
Если ваш сайт имеет зеркала, специальный робот зеркальщик определит их и сформирует группу зеркал вашего сайта. В поиске будет участвовать только главное зеркало. Вы можете указать его при помощи robots.txt, используя директиву 'Host', определив в качестве ее параметра имя главного зеркала. Директива 'Host' не гарантирует выбор указанного главного зеркала, тем не менее, алгоритм при принятии решения учитывает ее с высоким приоритетом. Пример:

#Если www.glavnoye-zerkalo.ru главное зеркало сайта, то robots.txt для
#www.neglavnoye-zerkalo.ru выглядит так
User-Agent: *
Disallow: /forum
Disallow: /cgi-bin
Host: www.glavnoye-zerkalo.ru


В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву 'Host' необходимо добавлять в группе, начинающейся с записи 'User-Agent', непосредственно после директив 'Disallow'('Allow'). Аргументом директивы 'Host' является доменное имя с номером порта (80 по умолчанию), отделенным двоеточием.

Параметр директивы Host обязан состоять из одного корректного имени хоста (т.е. соответствующего RFC 952 и не являющегося IP-адресом) и допустимого номера порта. Некорректно составленные строчки 'Host:' игнорируются.

Обратите внимание на юзер-агент, в котором прописана директива Host. Кроме того, роботы которые не понимают директивы host, должны её игнорировать (именно поэтому директива должна находиться в конце блока). Есть у кого-нибудь наблюдения и комментарии?

kimberlit
На сайте с 13.03.2007
Offline
370
#3
Yeugeny:
Одного никак не пойму, нафига делать в роботсе отдельный блок под Яндекс

Написать три сроки это так сложно и проблематично?

Yeugeny
На сайте с 01.02.2008
Offline
42
#4
kimberlit:
Написать три сроки это так сложно и проблематично?

Не в сложности вопрос, а в принципе. Зачем делать именно так, а не иначе?

Цахес
На сайте с 15.03.2007
Offline
205
#5
Yeugeny:
Зачем делать именно так, а не иначе?

Видите ли, дело в том, что некоторые роботы могут неправильно отреагировать на использование дополнительных директив. В связи с этим не рекомендуется использовать дополнительные директивы в секции «*».

То есть рекомендуется создавать специальные секции для нестандартных директив, таких как «Host».

В этом-то всё и дело.

- Хорошие и плохие тексты для ваших сайтов (http://www.textsale.ru/team57397.html). - Удаленная работа. Вакансия копирайтера/рерайтера. (http://advego.ru/6myq8sgvKk) - Быстрое составление семантического ядра (https://topvisor.ru/?inv=39380).
kimberlit
На сайте с 13.03.2007
Offline
370
#6
Yeugeny:
Зачем делать именно так, а не иначе?
Yeugeny:
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву 'Host' необходимо добавлять в группе, начинающейся с записи 'User-Agent', непосредственно после директив 'Disallow'('Allow').

Откуда вы знаете как другие роботы будут реагировать на секцию, в которой есть непонятная директива (пусть даже она написана в конце секции)? Может они её будут игнорировать полностью ...

ПС Это не тот вопрос, на котором нужно зацикливаться ... Напишите десяток строк в этом файле, залейте его и забудьте про свои принципы ...

Анализируйте лучше более существенные темы ...

ПС2 Yeugeny, вы привели цитату из хелпа Яндекса. Вся соль в том, что Яндекс нормально понимает User-agent: * ... А на то как другие ПС (их роботы) отреагируют на непонятную директиву ему (Яндексу) глубоко наплевать ... Поэтому в хелпе он и пишет, что можно использовать Host в * ....

Yeugeny
На сайте с 01.02.2008
Offline
42
#7

Цахес, kimberlit, спасибо. Думаю, правда нет особого смысла углубляться в тему.

[Удален]
#8
kimberlit:
Неправильно. Между секциями должна быть пустая строка.

User-agent: Yandex
Disallow: /cgi-bin/
Host: tyui.ru

User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /classes/
Disallow: /modules/
Disallow: /editor/
Disallow: /help/
Disallow: /templates/

Спасибо всем переделал как надо..

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий