Все вопросы по robots.txt

B4
На сайте с 27.04.2012
Offline
94
#311
SergioCre:
Писал вопрос в другой теме. Думаю, что правильно писать здесь.
Всем привет.
Имеется ряд страниц, которые необходимо закрыть от индексации. К примеру:
Страница:
http://сайт.ru/index.php/home/east
Закрываю:
Disallow: /*east

Проверяю здесь:
https://webmaster.yandex.ru/robots.xml
Написано - результат - разрешен.

Не понимаю в чем ошибка. Почему яндекс индексирует страницу? Прошу помощи.
Спасибо...

забыли: User-agent: *

Полный файл:

User-agent: *

Disallow: */east

SC
На сайте с 14.02.2015
Offline
0
#312

Спасибо.

Нет, я не забыл. просто не стал здесь указывать.

/*/east или */east ?

---------- Добавлено 16.02.2015 в 20:32 ----------

Проверяю здесь:

https://webmaster.yandex.ru/robots.xml

/*/east и */east

результат - разрешен.

Значит индексируется? не понимаю в чем проблема

---------- Добавлено 16.02.2015 в 20:37 ----------

Сейчас попробовал вообще закрыть.

User-agent: *

Disallow: /

снова проверяю здесь:

https://webmaster.yandex.ru/robots.xml

Набираю любую страницу, и пишет что разрешен. Вообще перестал, что то понимать. Что за фигня?

FP
На сайте с 12.02.2015
Offline
0
#313
SergioCre:
Спасибо.
Нет, я не забыл. просто не стал здесь указывать.
/*/east или */east ?

---------- Добавлено 16.02.2015 в 20:32 ----------

Проверяю здесь:
https://webmaster.yandex.ru/robots.xml
/*/east и */east

результат - разрешен.
Значит индексируется? не понимаю в чем проблема

---------- Добавлено 16.02.2015 в 20:37 ----------

Сейчас попробовал вообще закрыть.

User-agent: *
Disallow: /

снова проверяю здесь:
https://webmaster.yandex.ru/robots.xml

Набираю любую страницу, и пишет что разрешен. Вообще перестал, что то понимать. Что за фигня?

Проверь доступность по пути domain.ru/robots.txt

И накройняк пропиши правило отдельно для Яндекса

User-agent: Yandex

Disallow: /

User-agent: *

Disallow: /

Так же на страницах можешь отдавать мета-тег:

<meta name='robots' content='noindex,nofollow' />

S
На сайте с 17.02.2015
Offline
24
#314

охх, как всё сложно)

SC
На сайте с 14.02.2015
Offline
0
#315
frost-pixel:
Проверь доступность по пути domain.ru/robots.txt
И накройняк пропиши правило отдельно для Яндекса

User-agent: Yandex
Disallow: /
User-agent: *
Disallow: /

Так же на страницах можешь отдавать мета-тег:
<meta name='robots' content='noindex,nofollow' />

Пробовал так уже. Результат тот же...

B4
На сайте с 27.04.2012
Offline
94
#316
SergioCre:
Пробовал так уже. Результат тот же...

1)какой ответ серевера на файл https://webmaster.yandex.ru/server-response.xml

2)какое содержимое?

D
На сайте с 01.04.2013
Offline
30
#317

Я здесь читал интересную критику по robots.txt для блогов на WordPress.

GunFigter
На сайте с 20.03.2008
Offline
98
#318

Здравствуйте.

У меня вопрос по robots. Яндекс упорно индексирует несуществующие страницы - типа http://сайт/?id=xx

Запретил индексацию в robots:

User-agent: Yandex

Disallow: /?id=

После сегодняшнего апдейта - все без изменений. До этого стояла джумла и были подобные ссылки. На CMS запретить подобного рода ссылки невозможно, т.к. по сути выводит внутреннюю страницу, но без текста, с заголовком от главной страницы. И это очень сильно бьет по оптимизации сайта... посоветуйте, что можно сделать еще? 🤪

[Articler Alpha v1.07 (/ru/forum/comment/3282415)] и [Articler Beta (/ru/forum/347101)] | [Подбор доменов (/ru/forum/249478)] | {Socializating (/ru/forum/263463)}
B4
На сайте с 27.04.2012
Offline
94
#319
GunFigter:
Здравствуйте.

У меня вопрос по robots. Яндекс упорно индексирует несуществующие страницы - типа http://сайт/?id=xx

Запретил индексацию в robots:

User-agent: Yandex
Disallow: /?id=

После сегодняшнего апдейта - все без изменений. До этого стояла джумла и были подобные ссылки. На CMS запретить подобного рода ссылки невозможно, т.к. по сути выводит внутреннюю страницу, но без текста, с заголовком от главной страницы. И это очень сильно бьет по оптимизации сайта... посоветуйте, что можно сделать еще? 🤪

удалить из выдачи

Борис С
На сайте с 21.11.2008
Offline
109
#320

Добрый день.

Никак не могу сообразить как правильно запретить индексацию страниц для Wordpress.

У меня в теме Wordpresa выводится site.ru/page/5 и они дублируют главную страницу, и как наполняется сайт естественно этих страниц становится больше. Это мне надо закрыть от индексации

Но вот страницы в рубриках site.ru/rubrika/page/5 нужно оставить открытыми для индексации

Как это правильно прописать и сделать, чтобы в первом случаи все страницы page были закрыты от индексации, а во втором случае для страниц рубрики открыты?

Спасибо.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий