Disallow в роботсе

Е0
На сайте с 08.04.2006
Offline
95
991

Нам тут составили роботс тхт недавно, чтобы запретить к индексации все страницы сайта с www и чтобы основным зеркалом считался сайт без www

Выглядит он так:

User-Agent: Yandex

Host: womantalks.ru

А пару дней назад один из участников форума сказал: "Вам надо дописать Disallow в роботсе".

Зачем и как именно его туда вставить- не объяснил. Может быть кто-нибудь поможет?

lexalink
На сайте с 08.09.2005
Offline
304
#1

Екатерина01, см. мою подпись, много раз обсуждали ...

Вот так нужно:

User-Agent: *

Host: site.ru

Рад новым знакомствам ( арбитраж, майнинг, сео, трафик и т.д.) - @lexalink (https://t.me/lexalink)
Е0
На сайте с 08.04.2006
Offline
95
#2
lexalink:
Екатерина01, см. мою подпись, много раз обсуждали ...
Вот так нужно:
User-Agent: *
Host: site.ru

Ну разницы между тем что вы написали нашим вариантом почти нет. И тем более нет "Disallow". Т. е. по вашему он и не нужен?

Megavolt
На сайте с 23.12.2005
Offline
179
#3
lexalink:
User-Agent: *
Host: site.ru

это как раз хуже, директиву хост понимает только яшка, идеологически лучше, если только для него она и прописана. хотя практически я думаю другие поисковики просто проигнорят.

Иногда лучше жевать.... (С)
lexalink
На сайте с 08.09.2005
Offline
304
#4

Екатерина01, если вы хотите, чтобы yandex выводил в выдаче ваш сайт без www, то что я написал вам подойдёт :)

Е0
На сайте с 08.04.2006
Offline
95
#5
lexalink:
Екатерина01, если вы хотите, чтобы yandex выводил в выдаче ваш сайт без www, то что я написал вам подойдёт :)

Отлично. А то что у нас сейчас - нет?

lexalink
На сайте с 08.09.2005
Offline
304
#6

Megavolt, так yandex и нужен ;)

K
На сайте с 31.01.2001
Offline
737
#7

User-Agent: Yandex

Disallow:

Host: womantalks.ru

Не то чтобы "надо", но так ближе к стандарту.

Или запретить ненужную или несуществующую папку:

User-Agent: Yandex

Disallow: /eprst

Host: womantalks.ru

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
АК
На сайте с 07.02.2005
Offline
53
#8
Екатерина01:
Disallow в роботсе

Отсутствие директивы disallow является нарушением формата файла robots. Читайте здесь: http://www.citforum.ru/internet/search/rbtspec.shtml

Вообще-то эта ссылка - из помощи "Яндекса", ею тоже никогда не пренебрегайте!

Директива disallow обязана быть, в Вашем случае - скорее всего, пустой, если Вы не планируете закрывать какие-либо директории на сайте.

Затем ждите зеркальщика, а если был уже - ждите перезеркаливания после апдейтов... Но это может быть и долго, иногда 1,5 месяца бывало (не визит зеркальщика, а процесс переклейки в базе "Я").

Агента можно указывать хоть *, хоть явно. Директиву host все равно только "Я" понимает, другие игнорируют.

С уважением - Алексей

Е0
На сайте с 08.04.2006
Offline
95
#9
Алексей Коваль:
Отсутствие директивы disallow является нарушением формата файла robots. Читайте здесь: http://www.citforum.ru/internet/search/rbtspec.shtml

Вообще-то эта ссылка - из помощи "Яндекса", ею тоже никогда не пренебрегайте!

Директива disallow обязана быть, в Вашем случае - скорее всего, пустой, если Вы не планируете закрывать какие-либо директории на сайте.

Затем ждите зеркальщика, а если был уже - ждите перезеркаливания после апдейтов... Но это может быть и долго, иногда 1,5 месяца бывало (не визит зеркальщика, а процесс переклейки в базе "Я").

Агента можно указывать хоть *, хоть явно. Директиву host все равно только "Я" понимает, другие игнорируют.


С уважением - Алексей

Да мы ждем уже 2 месяца! Надоедает уже ждать.

За ссылочку спасибо.

АК
На сайте с 07.02.2005
Offline
53
#10

Екатерина01, вот Вам из той самой ссылки цитата:

"Если файл /robots.txt пуст, или не отвечает заданному формату и семантике, или его не существует, любой поисковый робот будет работать по своему алгоритму."

Два месяца, думаю, тоже не предел. Но лучше измените формат файла :).

Спасибо за внимание.

С ув. - АК.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий