Виндовом или юниксовом - Google - Поисковые системы

Гугль игнорирует robots.txt ?

Kastorskiy · 2005-03-01T06:53:25.0000000Z

Наконец-то дождался индексации сайта гуглем. Но вот незадача... в выдачу попали страницы, запрещённые к индексации. Или это я что-то делаю не так? Вот выдача: http://www.google.com/search?&q=allinurl:deep.webest.net/+site:deep.webest.net Файл robots.txt: http://deep.webest.net/robots.txt

K

62

Kastorskiy

5 марта 2005, 13:46

#11

Interitus, Кажется, Host не только Яндекс поддерживает, но и другие поисковики, например Рамблер. Я потому и подумал, что так будет лучше. Не хочется чтоб были проблемы с адресом с префиксом www и без него. А раньше были, до введения директивы Host. Или я ошибаюсь, и это на самом деле не так?

Лучше день потерять, а потом за пять минут долететь (c (http://andrey.lviv.ua/)) м/ф "Крылья, ноги, хвост"

Выбор главного зеркала для Файлов с критическими ошибками: Яндекс кобласит

[Удален]

5 марта 2005, 14:24

#12

Вообще-то можно написать и так, как вы написали. Просто по стандарту robots.txt должно игнорироваться незнакомое поле, а не секция целиком. То есть если другие поисковики будут следовать стандарту, а не брать пример с Гугля - то всё будет хорошо.

K

62

Kastorskiy

5 марта 2005, 14:47

#13

Интересно... вот прочитал:

Например, робот поисковой системы Google понимает расширенный формат robots.txt (в него входит, в частности, директива Allow для задания ссылок, доступ к которым разрешен, и директива Host для тех случаев, когда robots.txt описывает несколько веб-сайтов, либо один веб-сайт с несколькими "зеркалами".

взято отсюда: http://www.datapark.ru/CHulan/Upravlenierobotami.html

Это неверная инфа что-ли?

[Удален]

5 марта 2005, 14:49

#14

Насчет Host: неверная, Allow: правда понимает.

K

62

Kastorskiy

11 марта 2005, 11:24

#15

Сделал, как написал выше. Как к этому отнёсся Гугль, пока не знаю, ещё не было реакции.

А вот Апорт почему-то проиндексировал запрешённые страницы, до этого было всё нормально.

Правда подозреваю, что дело может быть в другом...

Когда менял robots.txt, прочитал, что он оказывается должен быть в юникс-формате, т.е. символом перевода строки должно быть не \r\n а \n. Вот и поменял формат и тогда залил.

Хотя до этого всегда использовал формат \r\n, проблем не замечал.

Собственно, вопрос, так в каком формате всё-таки правильно делать robots.txt?

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

V

41

vga

11 марта 2005, 13:08

#16

Смотрю я по логам и четко вижу, что игнорируют роботс.тхт практически все.

---------------- Порталостроитель. новости (http://news.qs.kiev.ua/), каталог сайтов и поиск (http://search.qs.kiev.ua/), Мобильные телефоны (http://mobile.qs.kiev.ua/) Цифровая техника (http://digital.qs.kiev.ua/) CD/DVD диски (http://cd.qs.kiev.ua/) Прайс-листы магазинов Украины (http://wheretobuy.com.ua)

S

173

Saney

11 марта 2005, 13:16

#17

Как писал vga
Смотрю я по логам и четко вижу, что игнорируют роботс.тхт практически все.

Если не лазить с гугл-баром, то не игнорирует, а с баром везде лазит, даже по https :).

Красивые сниппеты Google ( https://saney.com/tools/google-snippets-generator.html )

K

62

Kastorskiy

20 марта 2005, 13:48

#18

И всё-таки, в каком формате правильно делать robots.txt, виндовом или юниксовом?

Когда менял robots.txt, прочитал, что он оказывается должен быть в юникс-формате, т.е. символом перевода строки должно быть не \r\n а \n. Вот и поменял формат и тогда залил.
Хотя до этого всегда использовал формат \r\n, проблем не замечал.
Собственно, вопрос, так в каком формате всё-таки правильно делать robots.txt?

K

62

Kastorskiy

21 марта 2005, 21:50

#19

А Гугль продолжает индексить всё подряд, несмотря на переписанный robots.txt... И в том числе индексит то, что запрещено в мета-тегах...

Н

11

Начинающий

21 марта 2005, 22:51

#20

Я тоже задавал вопрос про то, в каком формате писат ьроботс. По-моему Шмель сказал, что в Виндовом тоже читает. Хотя. конечно, не все поисковики смогут в этом формате прочесть. Это уж наверняка. но я не программист, а проги, которая в другомформате даст мне роботс нет .Так что у меня выхода нет. Придется писать в блокноте.

Йога, мантра-медитация (http://bhakty-yoga.narod.ru/)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

Курс биткоина превысил $50 тысяч

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Гугль игнорирует robots.txt ?