Баг или ошибка в robots.txt ?

12
GG
На сайте с 05.01.2013
Offline
2
632

Привет.

Это баг робота Яху или моя криворукость в написании robots.txt ? Мне нужно полностью закрыть от индексации сайт для Яху, но открыть страницу с HTML картой сайта и чтобы робот Яху индексировал ссылки только через страницу карты сайта.

Я пишу:

User-Agent: Yahoo! Slurp
Disallow: /
Allow: /karta-sajta/
Allow: */uploads
Sitemap: http://www.mysite.ru/sitemap.xml
Sitemap: http://www.mysite.ru/sitemap.xml.gz

После полной переиндексации, Yahoo проиндексировал только страницу /karta-sajta/ и все. Дальше по ссылкам, которые на ней, не ходит. Состав ссылок на sitemap.xml равен составу на /karta-sajta/.

В чем дело-то ? Как правильно написать ?

P.S. Мне нужно именно через robots, а не через мета тэги.

wwwwww
На сайте с 29.04.2011
Offline
195
#1
GulfstreamG650:
Мне нужно полностью закрыть от индексации сайт для Яху
GulfstreamG650:
Дальше по ссылкам, которые на ней, не ходит.

А куда дальше он должен ходить, если все остальное запрещено?

Видишь? Свободная подпись.
GG
На сайте с 05.01.2013
Offline
2
#2

а как написать, чтобы ходил ? подскажите плиз (CMS Wordpress)

wwwwww
На сайте с 29.04.2011
Offline
195
#3
GulfstreamG650:
а как написать, чтобы ходил ?
GulfstreamG650:
Мне нужно полностью закрыть от индексации сайт для Яху

Так Вам закрыть от индексации надо или нет?

V3
На сайте с 26.08.2011
Offline
11
#4
GulfstreamG650:
полностью закрыть от индексации сайт
GulfstreamG650:
чтобы индексировал ссылки

Вы полностью и закрыли доступ к сайту, с чего ради должно что-то индексироваться?

D
На сайте с 08.01.2013
Offline
1
#5

Disallow: /

Пересмотрите эту политику

GG
На сайте с 05.01.2013
Offline
2
#6

Ну так мне нужно закрыть все, кроме карты сайта и ссылок на ней.

Я пытался это и прописать в роботсе...

kimberlit
На сайте с 13.03.2007
Offline
370
#7
GulfstreamG650:
Мне нужно полностью закрыть от индексации сайт для Яху, но открыть страницу с HTML картой сайта и чтобы робот Яху индексировал ссылки только через страницу карты сайта.

Только не пиши здесь формат старых и новых адресов, а то могут дать правильную подсказку.

GulfstreamG650:

Ну так мне нужно закрыть все, кроме карты сайта

С этой задачей ты справился.

GG
На сайте с 05.01.2013
Offline
2
#8
kimberlit:
Только не пиши здесь формат старых и новых адресов, а то могут дать правильную подсказку.
С этой задачей ты справился.

а что без сарказма нельзя ? трудно подсказать человеку ? зачем тогда форум

kimberlit
На сайте с 13.03.2007
Offline
370
#9
GulfstreamG650:
а что без сарказма нельзя ? трудно подсказать человеку ?

Можно. Без сарказма. Запрети старые и разреши новые. Помогло? Только не спрашивай как.

Y
На сайте с 26.04.2012
Offline
77
#10
GulfstreamG650:

Это баг робота Яху или моя криворукость в написании robots.txt ?

криворукость, а если точнее лень, выраженная в нежелании внимательно прочесть мануал по robots.txt

GulfstreamG650:
а что без сарказма нельзя ? трудно подсказать человеку ? зачем тогда форум

какой вопрос, такой ответ, нет вводной информации, не представлены примеры урл, нихрена не сказано о структуре разделов и тп.

исходя из данной информации есть следующие выходы:

1) внедрить директиву Allow: /раздел_сайта_со_статьями_подлежащими_индексированию/ - только в случае, если в этом разделе лежат только те материалы, которые нужно индексировать

2) разрешить к индексированию статьи

Allow: /razdel_1/statya_1

....

Allow: /razdel_n/statya_k

3) запретить индексацию набора статей:

Allow: /

Disallow: /razdel_1/statya_1

....

Disallow: /razdel_n/statya_k

Не беру и не ищу проекты.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий