robots.txt

12
siv1987
На сайте с 02.04.2009
Offline
427
#11
Odysseus:
Каждый раздел robots.txt начинается с User-agent

Спасибо кэп, впервые об это узнал.

Каждый новый раздел заставляет игнорировать значение предыдущего:

Да да, новый раздел...

Ну и впримере I не понятно зачем Allow: /index.php?page в разделе, где Disallow: только для /index.php? !

А вы не подумали, что я хочу разрешать только index.php который содержит параметр page и исключить index.php со всеми остальными параметрами? Не?

Может примеры и не очень живые, за то наглядно показывают как именно работает анализатор у гугла. А товарищам советую еще раз почитать четкую документацию, для начало у яндекса - очень доступная для понимания, потом сравнить ее с анализатором гугла. Кстати, эти примеры тоже можете проверить в яндексе и гугле вебмастере, и посмотреть на результат.

O
На сайте с 20.10.2008
Offline
101
#12
А вы не подумали, что я хочу разрешать только index.php который содержит параметр page и исключить index.php со всеми остальными параметрами? Не?

Честно говоря, как раз не понял! Слишком запутано было отписано :)

Для этого надо создать следующий robots.txt :

User-agent: *

Allow: /index.php?page

Disallow: /index.php?

но не наоборот.

Может примеры и не очень живые, за то наглядно показывают как именно работает анализатор у гугла. А товарищам советую еще раз почитать четкую документацию, для начало у яндекса - очень доступная для понимания, потом сравнить ее с анализатором гугла. Кстати, эти примеры тоже можете проверить в яндексе и гугле вебмастере, и посмотреть на результат.

Ну, собственно раздел форума то Google. На сколько я знаю различия есть. Но про Яндекс - это отдельная история.

42
siv1987
На сайте с 02.04.2009
Offline
427
#13

Odysseus, если делаете какие-то опровержения, пишите пожалуйста ниже, не исправляйте свой пост.

Odysseus:
В примере I, если поменять директивы Allow, Disallow местами, то:

А если бабушке приделать что-нибудь, то..

Odysseus:
Сам домен, к примеру, разрешён и много ещё чего разрешено, по сути...

Это у вас много чего разрешено, а у меня разрешено (по правилам гугла) конкретно то что мне нужно - index.php?page, остальной index.php запрещен. А больше на сайте я ничего не хочу запрещать для индексации.

Еще раз повторяю - это было приведено только как пример, так как анализатор у гугла и у яндекса имеют небольшие отличия в нюансах следования директив, и эти примеры явно это доказывают.

siv1987 добавил 09.12.2011 в 04:44

Odysseus:
User-agent: *
Allow: /index.php?page
Disallow: /index.php?
но не наоборот.

А теперь еще раз почитайте мой второй пост с предыдущей страницы, еще раз почитайте, а потом еще раз почитайте то что я написал в конце того поста.

S
На сайте с 26.01.2008
Offline
138
#14

не хотел создавать новую тему, спрошу тут:

помогите создать robots.txt, чтобы были закрыты страницы в ссылке которых есть слово "page", т.е. /page_1 , /page_2, и тд...

T
На сайте с 30.01.2006
Offline
109
#15

вот еще вариант:

User-Agent: *

Disallow: /*

Allow: /$

Гугл учит терпению!
siv1987
На сайте с 02.04.2009
Offline
427
#16
звезда читается гуглом как регулярное выражение, необходима (раздел форума Google)

ага, POSIX или PCRE?

может сразу так написать Disallow: /[A-Za-z_]+/.*?\.html$

звездочка это постановочный символ, который означает ноль или больше символов, позаимствованная из настоящих регулярных выражениях где она служит в качестве квантификатора.

V
На сайте с 24.01.2011
Offline
41
#17

sigiziy, попробуйте так:

User-Agent: *

Disallow: /page_*

Новая биржа (http://seobulls.ru/?ref=l2toplist) вечных ссылок!
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий