- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Простите за повтор,эта тема уже рассматривалась
Просто хочу уточнить
правильно составлен роботс?
Я хочу чтобы яндекс основным считал этот сайт без www
User-agent: Yandex
Disallow: /cgi-bin/
Host: tyui.ru
User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /classes/
Disallow: /modules/
Disallow: /editor/
Disallow: /help/
Disallow: /templates/
Неправильно. Между секциями должна быть пустая строка.
User-agent: Yandex
Disallow: /cgi-bin/
Host: tyui.ru
User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /classes/
Disallow: /modules/
Disallow: /editor/
Disallow: /help/
Disallow: /templates/
Одного никак не пойму, нафига делать в роботсе отдельный блок под Яндекс, если блоки отличаются только записью Host. По-крайней мере, сам Яндекс говорит так http://help.yandex.ru/webmaster/?id=996567#996574:
Если ваш сайт имеет зеркала, специальный робот зеркальщик определит их и сформирует группу зеркал вашего сайта. В поиске будет участвовать только главное зеркало. Вы можете указать его при помощи robots.txt, используя директиву 'Host', определив в качестве ее параметра имя главного зеркала. Директива 'Host' не гарантирует выбор указанного главного зеркала, тем не менее, алгоритм при принятии решения учитывает ее с высоким приоритетом. Пример:
#Если www.glavnoye-zerkalo.ru главное зеркало сайта, то robots.txt для
#www.neglavnoye-zerkalo.ru выглядит так
User-Agent: *
Disallow: /forum
Disallow: /cgi-bin
Host: www.glavnoye-zerkalo.ru
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву 'Host' необходимо добавлять в группе, начинающейся с записи 'User-Agent', непосредственно после директив 'Disallow'('Allow'). Аргументом директивы 'Host' является доменное имя с номером порта (80 по умолчанию), отделенным двоеточием.
Параметр директивы Host обязан состоять из одного корректного имени хоста (т.е. соответствующего RFC 952 и не являющегося IP-адресом) и допустимого номера порта. Некорректно составленные строчки 'Host:' игнорируются.
Обратите внимание на юзер-агент, в котором прописана директива Host. Кроме того, роботы которые не понимают директивы host, должны её игнорировать (именно поэтому директива должна находиться в конце блока). Есть у кого-нибудь наблюдения и комментарии?
Одного никак не пойму, нафига делать в роботсе отдельный блок под Яндекс
Написать три сроки это так сложно и проблематично?
Написать три сроки это так сложно и проблематично?
Не в сложности вопрос, а в принципе. Зачем делать именно так, а не иначе?
Зачем делать именно так, а не иначе?
Видите ли, дело в том, что некоторые роботы могут неправильно отреагировать на использование дополнительных директив. В связи с этим не рекомендуется использовать дополнительные директивы в секции «*».
То есть рекомендуется создавать специальные секции для нестандартных директив, таких как «Host».
В этом-то всё и дело.
Зачем делать именно так, а не иначе?
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву 'Host' необходимо добавлять в группе, начинающейся с записи 'User-Agent', непосредственно после директив 'Disallow'('Allow').
Откуда вы знаете как другие роботы будут реагировать на секцию, в которой есть непонятная директива (пусть даже она написана в конце секции)? Может они её будут игнорировать полностью ...
ПС Это не тот вопрос, на котором нужно зацикливаться ... Напишите десяток строк в этом файле, залейте его и забудьте про свои принципы ...
Анализируйте лучше более существенные темы ...
ПС2 Yeugeny, вы привели цитату из хелпа Яндекса. Вся соль в том, что Яндекс нормально понимает User-agent: * ... А на то как другие ПС (их роботы) отреагируют на непонятную директиву ему (Яндексу) глубоко наплевать ... Поэтому в хелпе он и пишет, что можно использовать Host в * ....
Цахес, kimberlit, спасибо. Думаю, правда нет особого смысла углубляться в тему.
Неправильно. Между секциями должна быть пустая строка.
User-agent: Yandex
Disallow: /cgi-bin/
Host: tyui.ru
User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /classes/
Disallow: /modules/
Disallow: /editor/
Disallow: /help/
Disallow: /templates/
Спасибо всем переделал как надо..