Гугль игнорирует robots.txt ?

123
K
На сайте с 20.12.2004
Offline
62
#11

Interitus, Кажется, Host не только Яндекс поддерживает, но и другие поисковики, например Рамблер. Я потому и подумал, что так будет лучше. Не хочется чтоб были проблемы с адресом с префиксом www и без него. А раньше были, до введения директивы Host. Или я ошибаюсь, и это на самом деле не так?

Лучше день потерять, а потом за пять минут долететь (c (http://andrey.lviv.ua/)) м/ф "Крылья, ноги, хвост"
[Удален]
#12

Вообще-то можно написать и так, как вы написали. Просто по стандарту robots.txt должно игнорироваться незнакомое поле, а не секция целиком. То есть если другие поисковики будут следовать стандарту, а не брать пример с Гугля - то всё будет хорошо.

K
На сайте с 20.12.2004
Offline
62
#13

Интересно... вот прочитал:

Например, робот поисковой системы Google понимает расширенный формат robots.txt (в него входит, в частности, директива Allow для задания ссылок, доступ к которым разрешен, и директива Host для тех случаев, когда robots.txt описывает несколько веб-сайтов, либо один веб-сайт с несколькими "зеркалами".

взято отсюда: http://www.datapark.ru/CHulan/Upravlenierobotami.html

Это неверная инфа что-ли?

[Удален]
#14

Насчет Host: неверная, Allow: правда понимает.

K
На сайте с 20.12.2004
Offline
62
#15

Сделал, как написал выше. Как к этому отнёсся Гугль, пока не знаю, ещё не было реакции.

А вот Апорт почему-то проиндексировал запрешённые страницы, до этого было всё нормально.

Правда подозреваю, что дело может быть в другом...

Когда менял robots.txt, прочитал, что он оказывается должен быть в юникс-формате, т.е. символом перевода строки должно быть не \r\n а \n. Вот и поменял формат и тогда залил.

Хотя до этого всегда использовал формат \r\n, проблем не замечал.

Собственно, вопрос, так в каком формате всё-таки правильно делать robots.txt?

V
На сайте с 13.01.2003
Offline
41
vga
#16

Смотрю я по логам и четко вижу, что игнорируют роботс.тхт практически все.

---------------- Порталостроитель. новости (http://news.qs.kiev.ua/), каталог сайтов и поиск (http://search.qs.kiev.ua/), Мобильные телефоны (http://mobile.qs.kiev.ua/) Цифровая техника (http://digital.qs.kiev.ua/) CD/DVD диски (http://cd.qs.kiev.ua/) Прайс-листы магазинов Украины (http://wheretobuy.com.ua)
S
На сайте с 25.12.2003
Offline
173
#17
Как писал vga
Смотрю я по логам и четко вижу, что игнорируют роботс.тхт практически все.

Если не лазить с гугл-баром, то не игнорирует, а с баром везде лазит, даже по https :).

Красивые сниппеты Google ( https://saney.com/tools/google-snippets-generator.html )
K
На сайте с 20.12.2004
Offline
62
#18

И всё-таки, в каком формате правильно делать robots.txt, виндовом или юниксовом?

Когда менял robots.txt, прочитал, что он оказывается должен быть в юникс-формате, т.е. символом перевода строки должно быть не \r\n а \n. Вот и поменял формат и тогда залил.
Хотя до этого всегда использовал формат \r\n, проблем не замечал.
Собственно, вопрос, так в каком формате всё-таки правильно делать robots.txt?
K
На сайте с 20.12.2004
Offline
62
#19

А Гугль продолжает индексить всё подряд, несмотря на переписанный robots.txt... И в том числе индексит то, что запрещено в мета-тегах...

Н
На сайте с 15.03.2005
Offline
11
#20

Я тоже задавал вопрос про то, в каком формате писат ьроботс. По-моему Шмель сказал, что в Виндовом тоже читает. Хотя. конечно, не все поисковики смогут в этом формате прочесть. Это уж наверняка. но я не программист, а проги, которая в другомформате даст мне роботс нет .Так что у меня выхода нет. Придется писать в блокноте.

Йога, мантра-медитация (http://bhakty-yoga.narod.ru/)
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий