- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Проблема уже обсуждалась:
Нужно запретить зеркало сайта - домен третьего уровня на том же хостинге, что и основной сайт - домен второго уровня.
Из того что я нашел через поиск:
1. можно в robots.txt добавить Host: www.site.ru
User-Agent: *
Host: www.site.ru
(таки образом как я понимаю domen.site.ru - будет не запрещен к индексации, а склеин?)
2. Если сервер Apache, то можно вместо использования директивы Host задать robots.txt с использованием директив SSI:
<!--#if expr=" \"${HTTP_HOST}\" != \"www.site.ru\" " -->
User-Agent: *
Disallow: /
<!--#endif -->
(в этом случае domen.site.ru будет запрещен к индексации?)
3. На домен-зеркало третьего уровня прописать свой robots.txt
Host: domen.site.ru
User-Agent: *
Disallow: /
(в этом случае domen.site.ru будет запрещен к индексации?)
4. Использовать одновременно 1-ый и 3-ий способы.
Собственно вопрос: Какой из вышеперечисленных способ наиболее грамотный и правильный?
Если есть возможность, то для domen.site.ru положить свой robots.txt, в котором написать следующее:
User-agent: *
Disallow: /
Host: www.site.ru
В этом случае Яндекс приклеит domen.site.ru к www.site.ru, а остальные поисковики его просто не будут индексировать.
Это не соответствует действительности. Некоторые поисковики абсолютно справедливо будут игнорировать директиву Disallow: / как размещённую в неверно оформленной секции. Проверено на личном поыте. Поэтому правильнее составить для зеркала такой robots.txt:
Cherny, AiK, спасибо большое за ответы.
Но оказывается домен и поддомен лежат на одном хостинге, и используют одну базу, правда в разных папках. Домен в папке htdocs, а поддомен в отдельной папке. Будет ли в этом случае верным заливать и туда и туда разный robots.txt?
Уж очень не хочется из-за этого потом проблемы с индексацией получить.
Блин. Мой склероз меня подводит :( Деректива Host работает только в том случае, если robots.txt идентичен на обоих сайтах.
Иначе, например, вот такой robots.txt
http://www.h12.ru/robots.txt
мог бы повлечь за собой склеивание всех поддоменов у хостера. Правда скорее всего зеркальщик, не найдя соответствия между сайтами, просто игнорировал бы директиву Host.
Так что если robots.txt разные, то директива Host не нужна - просто домен закрывается от индексации, если нужно конечно.
А если они одинаковые, то в моём примере следует оставить пустой директиву Disallow (ну или запрещать только то, что реально нужно всем запретить).
реально нужно запретить весть домен третьего уровня - он является точной копией основного сайта, только другим по дизайну.
в качестве примера:
http://www.rambler.ru/
http://classic.rambler.ru/ Только если у Рамблера это всего лишь копия главной, то у меня весь сайт.
Что-то я них там не увидел robots.txt на поддомене?
Такс, вот еще один пример:
http://www.inosmi.ru/
http://www.inosmi.ru/text/
здесь они не другой дизайн, а тектовую версию сделали, и не через поддомен, а через директиву /text/
robots.txt я у них опять таки не вижу.
Такс, вот еще один пример:
h**p://www.inosmi.ru/
h**p://www.inosmi.ru/text/
Так это ж один домен
Закрыть домен от индексации (роботсом). Не претендую на жуткую грамотность, за то это самый простой способ. :)
Удачи.
AiK, спасибо за замечания.
Ceres, если сайт на поддомене отличается дизайном, то лучше просто запретить его индексировать, без использования директивы Host
В общем мы сделали вот так - robots.txt на поддомене
User-agent: Yandex
Disallow:
Host: www.site.ru
User-agent: *
Disallow:
у меня два домена они являются полными зеркалами так как припаркованы к одной и той же папке
site1.ru и site2.ru
вот что именно я должен прописать в robots.txt чтобы для всех роботов основным сайтом являлся site1.ru
а то в некоторых поисковиках проиндексирован второй, а в некоторых первый :-(