Вопрос по robots.txt

Deni
На сайте с 15.04.2006
Offline
355
#51
Страница может быть открыта как http://www.****.ru/login/ и как http://www.****.ru/login
То есть без слеша на конце

Стоит ли прописывать оба этих варианта? Или ограничиться только со слешем. На сайте все урлы прописаны со слешем но поисковик мало ли где найдет упоминания без слеша.........

User-agent: *
Disallow: /usercp/
Disallow: /register/
Disallow: /login/
Disallow: /search/
AVV:
В данном случае, должно быть только (!!!) без слеша:
закрываем и для http://www.****.ru/login/ и для http://www.****.ru/login

Disallow: /login

Не смотря на все советы опубликованные тут столкнулся с проблеМММой

Яндекекс скушал www.всетут.ru/admin/ до того как она была зактыта robots.txt

Сейчас по советам все папки установлены без завершающего слеша

Disallow: /admin

Решил ее удалить вручную в яндексе

Добавляю там www.всетут.ru/admin/ (удалить весь каталог) А мне яндекс пишет что не может ее удалить так как она не запрещена к индексации

Убираю слешь и он пишет что удалит через некоторое время.

Значит получается директивы

Disallow: /admin

Disallow: /admin/

Все же разные и певая строка не запрезает индексацию урла со слешем а это подразумевает что и /admin/555 тоже будут проиндексированы?

Блин проверил и http://www.всетут.ru/admin/?a=articles спокойно добавился :(

Итого делаю вывод что не смотря на заверения и советы на форуме требуется закрывать одновременно оба варианта
Disallow: /admin
Disallow: /admin/
AVV
На сайте с 31.07.2006
Offline
84
AVV
#52

А если так?

User-agent: Yandex
Disallow: /admin
Host: www.всетут.ru

User-agent: *
Disallow: /admin
Deni
На сайте с 15.04.2006
Offline
355
#53
AVV:
А если так?

Хост прописан

Но ведь Как я уже сказал Яндекс считает

Disallow: /admin
Disallow: /admin/

Разными совершенно урлами.

Ваш пример от моего первичного отличается только добавлением хоста, а он у меня прописан просто я на этом не акцентировал внимания

ЗЫ Кажется Яндекс совсем сломали :( Ввожу http://www.yandex.ru/cgi-bin/test-robots?host=www.****.ru

И пишет что ничего не запрещено

А у меня там

User-agent: *
Disallow: /cnstats
Disallow: /usercp
Disallow: /register
Disallow: /login
Disallow: /search
Disallow: /admin
Disallow: /submit
Disallow: /img
Disallow: /cnstats/
Disallow: /usercp/
Disallow: /register/
Disallow: /login/
Disallow: /search/
Disallow: /admin/
Disallow: /submit/
Disallow: /img/
User-agent: Yandex
Host: www.****.ru
AVV
На сайте с 31.07.2006
Offline
84
AVV
#54
Deni:
отличается только добавлением хоста, а он у меня прописан просто я на этом не акцентировал внимания

Я имел в виду, что если у вас в роботс прописаны строки User-agent для разных поисковиков, то и Disallow: для разных поисковиков должны повторяться несколько раз.

А не так:


User-agent: Yandex
Disallow:
Host: www.всетут.ru

User-agent: *
Disallow: /admin

И не так:

User-agent: Yandex
Disallow: /admin
Host: www.всетут.ru

User-agent: *
Disallow:

Если не в этом причина, тогда вообще странно.

Deni
На сайте с 15.04.2006
Offline
355
#55

Методом эксперементов было определено что яндекс не всегда воспринимает строку

User-agent: *

если ниже находится

User-agent: Yandex

Возможно уже "баян"

AVV
На сайте с 31.07.2006
Offline
84
AVV
#56
Deni:

А у меня там
User-agent: *
Disallow: /cnstats
Disallow: /usercp
Disallow: /register
Disallow: /login
Disallow: /search
Disallow: /admin
Disallow: /submit
Disallow: /img
Disallow: /cnstats/
Disallow: /usercp/
Disallow: /register/
Disallow: /login/
Disallow: /search/
Disallow: /admin/
Disallow: /submit/
Disallow: /img/


User-agent: Yandex
Host: www.****.ru

Правильно должно быть так:

User-agent: *
Disallow: /cnstats
Disallow: /usercp
Disallow: /register
Disallow: /login
Disallow: /search
Disallow: /admin
Disallow: /submit
Disallow: /img
User-agent: Yandex
Disallow: /cnstats
Disallow: /usercp
Disallow: /register
Disallow: /login
Disallow: /search
Disallow: /admin
Disallow: /submit
Disallow: /img
Host: www.****.ru
Deni:
Методом эксперементов было определено что яндекс не всегда воспринимает строку
User-agent: *
если ниже находится
User-agent: Yandex

Это общеизвестный факт.

p.s. Значит, все таки, причина была не в Яндексе, а в вашем файле роботс. ;)

Deni
На сайте с 15.04.2006
Offline
355
#57

Причина во мне.

Но тем не менее первый мой сегодняшний пост описал другую проблеМММу.

У меня было прописано неправильно (просто раньше директиву хост никогда не ставил) но тем не менее вручную не мог удалить станицы из индекса так как Яндекс по разному воспринимал со слешем и без

AVV
На сайте с 31.07.2006
Offline
84
AVV
#58

Вот файл роботс самого Яндекса, посмотрите, как он составлен:


User-agent: *
Disallow: /?
Disallow: /404.html
Disallow: /about.html
Disallow: /advanced_engl.html
Disallow: /advertising
Disallow: /articles
Disallow: /chisla.html
Disallow: /cgi-bin/
Disallow: /cgi/
Disallow: /cy
Disallow: /dzen.html
Disallow: /i/
Disallow: /ie3/yandsearch
Disallow: /keyboard_qwerty.html
Disallow: /logotypes
Disallow: /norobot
Disallow: /polling
Disallow: /redir
Disallow: /regions.html?
Disallow: /s/
Disallow: /setup
Disallow: /skazki
Disallow: /subscribe/confirm.pl
Disallow: /subscribe/view.pl
Disallow: /yaca
Disallow: /ya
Host: www.yandex.ru

Ничего здесь не дублируется со слешем и без слеша.

Т.е.,

Disallow: /cy

Disallow: /ya

закрывает одновременно и

Disallow: /cy/

Disallow: /ya/

Deni
На сайте с 15.04.2006
Offline
355
#59

AVV, Видел его конечно. .

Только директива Хост нужна только для Яндекса и поэтому как я понимаю все прописывают

User-agent: Yandex
Host: www.****.ru

А именно тут у меня Яндекс и споткнулся так как с глюком стал читать директиву User-agent:*

Глюк я так понимаю был в том что он то читал это то нет

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий