Яндекс накосячил с соблюдением стандарта файла robots.txt

wolf
На сайте с 13.03.2001
Offline
1183
#11
Получается, что директива "User-Agent: Yandex" отменяет полностью то, что "для всех"...

Яндекс выполняет директивы только "своей" секции

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
RC
На сайте с 12.04.2005
Offline
18
#12
Яндекс выполняет директивы только "своей" секции

Не логично, значит все-таки, наличие секции для Яндекса отменяет "для всех" не знал... Что ж, бегу править...

Больше я к realty.cd никакого отношения не имею. Компания разорилась, домен просрочен и регнут кем-то заново. Вот так вот.
wolf
На сайте с 13.03.2001
Offline
1183
#13

Логично-нелогично, но стандарт есть стандарт. Читаем http://www.robotstxt.org/wc/norobots.html :


User-agent
...
If the value is '*', the record describes the default access policy for any robot that has not matched any of the other records.
RC
На сайте с 12.04.2005
Offline
18
#14

wolf, Спасибо большое!

Slc
На сайте с 27.06.2003
Offline
150
Slc
#15
help-kenny:
нам ответили что оба варианта верны и надо ждать когда эти сайты отзеркалируются :)

Вот что ответили из Яндекса, по поводу выпадания трех сайтов

По всей видимости, проиндексированные страницы Ваших сайтов были удалены
из
поиска по каким-то техническим причинам, возможно из-за каких то проблем
на
сервере, на котором они размещены. Попробуйте проверить это по логам
сервера.

Сейчас мы можем определенно сказать, что никаких запретов на
индексирование
сайтов с нашей стороны нет.

Обратите также внимание на несколько некорректную запись в robots.txt
ваших
сайтов:

User-Agent: *
Disallow:
Host: www.site.ru

Лучше так:

User-Agent: *
Host: www.site.ru

Disallow: может появляться при наличии каких-то запретов, например:

User-Agent: *
Disallow: /folder/
Host: www.site.ru
А
На сайте с 14.11.2003
Offline
150
#16
Slc:
Обратите также внимание на несколько некорректную запись в robots.txt
ваших
сайтов:

User-Agent: *
Disallow:
Host: www.site.ru

Лучше так:

User-Agent: *
Host: www.site.ru

Disallow: может появляться при наличии каких-то запретов, например:

User-Agent: *
Disallow: /folder/
Host: www.site.ru

Вот видите, яндексоиды тоже мыслят логично, но при этом не соблюдают стандарты robots.txt.=)

O
На сайте с 01.07.2005
Offline
49
#17
Slc:
Вот что ответили из Яндекса, по поводу выпадания трех сайтов

Вот и у меня сайт с

Disallow:

пропал

Удалил я robots.txt терь надеюсь проиндексирует заново

Antigate.com - инвайт b0eda5f6fa
keks
На сайте с 28.04.2004
Offline
97
#18

Проехал... ;)

spark
На сайте с 24.01.2001
Offline
130
#19

Мда. Вот еще один вариант роботса, относительно которого саппорт Яндекса сказал, что он верен.

User-agent: *

Disallow:

User-agent: Yandex

Disallow:

Host: www.site.ru

По-моему, единого понимания стандарта даже среди саппорта не наблюдается. Если разработчики проявляли подобный же плюрализм, вполне возможно, что разные роботы Яндекса по разному воспринимают одни и те же директивы.

Самое неприятное в этом, что предлагаемый в хелпе Яндекса вариант однозначно не верен, потому что Яндекс не единственный робот, и надо думать также о Гугле, МСН, Яху и прочих, которые host не поддерживают, а тут еще и disallow предлагается опускать.

Возможно, москвичам это не критично, но есть домены, в которых Яндекс отнюдь не основной трафикогенератор.

-=Илья=-
На сайте с 05.12.2003
Offline
222
#20

А написать

User-agent: *

Disallow: /test/

Host: www.site.ru

Религия не позволяет?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий