Индексация запрещённых страниц

12
Антоний Казанский
На сайте с 12.04.2007
Offline
786
#11
Mikelius:
"По умолчанию к концу каждого правила, описанного в robots.txt, приписывается '*'"

так что
Disallow: /reading.php
=
Disallow: /reading.php*

вы точно уверены, что это действует на указанный документ?

например, инструкция

Disallow: /reading/

запрещает все адрес site.ru/reading/какие-угодно-страницы.html

а вот в одном корневом уровне, адреса

/reading.php и reading.php?чего-нибудьтам-еще теоретически могут вести на разные веб документы.


а вот
Disallow: /404.html
не запрещает 404.htm

а с чего бы не запрещает?

√ SEO продвижение ► https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Разговоры о SEO и не только: культурно, вежливо, доброжелательно ► https://t.me/seotusovochka
wwwwww
На сайте с 29.04.2011
Offline
195
#12
anthony_:
а с чего бы не запрещает?

А с чего запрещает?

Disallow: /404.html
не запрещает 404.htm
Видишь? Свободная подпись.
seo_optimist
На сайте с 09.09.2009
Offline
108
#13
Sower:
Зачем там прописывать NOFOLLOW?

ТССС Лучше пусть пишут!

А вообще если задуматься, зачем закрывать то на что активно ссылаются?

Антоний Казанский
На сайте с 12.04.2007
Offline
786
#14
wwwwww:
А с чего запрещает?

согласен, не запрещает, я литеру «l» не заметил :o

M
На сайте с 20.06.2011
Offline
5
#15
anthony_:
вы точно уверены, что это действует на указанный документ?

например, инструкция

Disallow: /reading/

запрещает все адрес site.ru/reading/какие-угодно-страницы.html

а вот в одном корневом уровне, адреса
/reading.php и reading.php?чего-нибудьтам-еще теоретически могут вести на разные веб документы.

http://help.yandex.ru/webmaster/?id=996567#996572

написано что так, да и ручная проверка страниц в Инструментах вебмастера гугла и яндекса это подтверждает

если вы заблокировали эту страницу с помощью файла robots.txt, мы также не сможем увидеть этот тег

это уже какое-то противоречие - гугл видит страницы, заблокированные роботсом, но не видит метатег ноиндекс на них?

V
На сайте с 24.01.2011
Offline
41
#16

У меня в роботсе стоят запрет на индексацию определенных рубрик, google в упор не слушает роботс, а вот яндекс после месяца, наконец-таки послушался и начал выкидывать из поска страницы закрытые в роботсе.

Новая биржа (http://seobulls.ru/?ref=l2toplist) вечных ссылок!
богоносец
На сайте с 30.01.2007
Offline
774
#17
Mikelius:
это уже какое-то противоречие

Эта страница хелпа очень активно изменяется...

O
На сайте с 20.10.2008
Offline
101
#18
Владимир-C:
В роботсе написано:
User-agent: *

Disallow: /flash/
Disallow: /images/
Disallow: /reading.php
Disallow: /404.html


И, тем не менее, в перечне проиндексированных гуглом страниц вижу такой список:
rect.ru/404.htm

rect.ru/reading.php?n=11
rect.ru/reading.php?n=20
rect.ru/reading.php?n=2
rect.ru/reading.php?n=10


Как полагаете, почему так?

Ну с /404.htm - тут всё как и надо, так как зхапрет на более длинный урл /404.html

C reading.php - хер его знает, я бы посоветовал продублировать

Disallow: /reading.php

Disallow: /reading.php*

Тут ещё кое что:

Является ли

User-agent: *

Disallow: /flash/
Disallow: /images/
Disallow: /reading.php
Disallow: /404.html

последним блоком в файле robots?

42
ВC
На сайте с 02.02.2006
Offline
463
#19

Да, этот блок является последним.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий