Будет ли Yandex воспринимать команду Host в robots.txt при запрещающем Disallow?

VA
На сайте с 17.08.2008
Offline
10
976

Мне нужно чтобы Яндекс склеил зеркало сайта с главным доменом (чтобы ТИЦ и бэк-линки зеркала передались главному домену) и при этом, чтобы до того как произойдет склейка, зеркало в поисковой выдаче отсутствовало. Собираюсь залить на зеркало такой robots.txt


User-Agent: *
Disallow: /
Host: www.glavnuj_site.ru

Вопрос: Будет ли Яндекс выполнять команду Host при запрещающей команде Disallow?

S2
На сайте с 07.01.2008
Offline
611
#1

Мне кажется лучше удалить сайт - когда выпадет из индекса ПС - 301 редирект.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
VA
На сайте с 17.08.2008
Offline
10
#2

Str256, уже удалял, причем на 3 с лишним месяца, однако он все равно упорно оставался в поисковой выдаче (причем в ТОПе на 3 месте) с надписью внизу "найден по ссылке".

S2
На сайте с 07.01.2008
Offline
611
#3

А пока удаляли, было так написано?

User-agent: Yandex

Disallow: /

User-agent: *

Disallow: /

Если да, то в панели вебмастер Яндекса и Гугла - не забыли указать удалить сайт?

VA
На сайте с 17.08.2008
Offline
10
#4

Str256

User-agent: Yandex

Disallow: /

S2
На сайте с 07.01.2008
Offline
611
#5
Vlasov Alexey:
Str256
User-agent: Yandex
Disallow: /

Пост №4

Гугол - после указания через пару дней всё убирает, даже при наличии сайта.

Яндекс - если сайт убрать - при наличии выше написанного мной через несколько дней.

VA
На сайте с 17.08.2008
Offline
10
#6

Скажите, а если я хочу разрешить доступ к сайту только роботу-зеркальщику Яндекса, корректен ли будет такой robots.txt


User-agent: Yandex/1.01.001 (compatible; Win16; H)
Disallow:
Host: www.glavnuj_site.ru

User-agent: *
Disallow: /

Или Яндекс не воспримет такую запись?

Каширин
На сайте с 03.01.2004
Offline
1018
#7
Vlasov Alexey:
Скажите, а если я хочу разрешить доступ к сайту только роботу-зеркальщику Яндекса, корректен ли будет такой robots.txt

Или Яндекс не воспримет такую запись?

User-agent: Yandex/1.01.001 (compatible; Win16; H)

Фантазиями не занимайтесь, есть только один юзерагент для Яндекса: Yandex.

VA
На сайте с 17.08.2008
Offline
10
#8

Каширин какие фантазии, Яндекс же сам пишет об этом роботе: http://help.yandex.ru/webmaster/?id=995296


А как в логах сервера называется ваш робот? Ваш робот "ходит" с одного IP-адреса?

У Яндекса есть несколько роботов, которые представляются по-разному.

Yandex/1.01.001 (compatible; Win16; I) — основной индексирующий робот
Yandex/1.01.001 (compatible; Win16; P) — индексатор картинок
Yandex/1.01.001 (compatible; Win16; H) — робот, определяющий зеркала сайтов
Yandex/1.02.000 (compatible; Win16; F) — робот, индексирующий пиктограммы сайтов (favicons)
Yandex/1.03.003 (compatible; Win16; D) — робот, обращающийся к странице при добавлении ее через форму «Добавить URL»
Yandex/1.03.000 (compatible; Win16; M) — робот, обращающийся при открытии страницы по ссылке «Найденные слова»
YaDirectBot/1.0 (compatible; Win16; I) — робот, индексирующий страницы сайтов, участвующих в Рекламной сети Яндекса
YandexBlog/0.99.101 (compatible; DOS3.30; Mozilla/5.0; B; robot) — робот поиска по блогам, индексирующий коментарии постов
S2
На сайте с 07.01.2008
Offline
611
#9

Ну и что, Каширин правильно говорит, если напишите в User-agent что-либо кроме Yandex - робот это просто не воспримет.

Попробуйте запретить через .htaccess по названию или IP.

Вот посмотрите пример, можете проконсультироваться с автором.

K
На сайте с 31.01.2001
Offline
737
#10
Vlasov Alexey:
Будет ли Яндекс выполнять команду Host при запрещающей команде Disallow?
Vlasov Alexey:
У Яндекса есть несколько роботов, которые представляются по-разному.

Да тут многие в курсе :). Только читать надо не про переменную User-agent, а про то, как Яндекс обрабатывает robots.txt. Str256 написал правильно, почти:

Str256:
если напишите в User-agent что-либо кроме Yandex - робот это просто не воспримет.

На самом деле Яндекс воспримет любую строку, начинающуюся с Yandex, и она будет действовать на всех его роботов: http://help.yandex.ru/webmaster/?id=996567#996568

"В самом robots.txt проверяется наличие записей, начинающихся с 'User-agent:', в них ищутся подстроки 'Yandex', либо '*' (регистр значения не имеет), причем, если обнаружено 'User-agent: Yandex', директивы для 'User-agent: *' не учитываются."

Vlasov Alexey:
Скажите, а если я хочу разрешить доступ к сайту только роботу-зеркальщику Яндекса

Короче, такой функции в robots.txt для Яндекса не предусмотрено, ибо нефиг мудрить, а то потом службу поддержки задолбают изобретатели хитровыдуманных robots.txt . Они даже директиву Host: собирались отменить, а то слишком много вопросов задают.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий