Все вопросы по robots.txt - 2

I
На сайте с 14.10.2010
Offline
66
#131
autoschrott:
вот есть сайт, у него есть 2 вида категорий

site.com/lol
и
site.com/lol?lang=ru

Это всё единая категория, но проблема в том что это создаёт дубль, гугл их видит.

Решения проблемы:

rel canonical
301
Эти варианты мне понятные, но меня интересует как заблокировать такую страницу чисто robots.txt, для меня этот вариант в данный момент более правильный, ибо структура сайта довольно сложная.

Буду очень рад за помощь!

---------- Добавлено 22.06.2018 в 16:21 ----------

Короче разобрался, сделал так

Disallow: *?lang=ru* роботс тхт показывает что всё ок, страницы закрыты ☝

Если подходит вариант заблокировать все страницы содержащие "?lang=ru" используйте:

Disallow: /*?lang=ru*

Если нужно заблокировать только "/lol?lang=ru" используйте:

Disallow: /lol?lang=ru*

S
На сайте с 04.02.2007
Offline
318
svv
#132

Есть страница вида:

www.site.ru/categ/group1 - она должна быть в индексе

www.site.ru/categ/group1/что_угодно - нужно запретить индексацию в robots.txt

Помогите с тем, как корректно это сделать, чтобы первая ссылка тоже не улетела?

D.iK.iJ
На сайте с 26.05.2013
Offline
224
#133

Ну если страница и правда www.site.ru/categ/group1 без слеша, то можно закрыть /categ/group1/

Чтобы не улетело - сразу проверяете в вебмастере.

Адаптивный дизайн в 2 строчки ( https://dikij.com/wm/adaptaciya-saytov.php ). + Принимаю заказы любой сложности ( https://searchengines.guru/ru/forum/926323 ). 💎 Еще я делаю классные кулоны с опалами ( https://mosaicopal.ru/ ).
S
На сайте с 04.02.2007
Offline
318
svv
#134

УФФФФ - как же их много :)

А реально написать строку, запрещающую далее определённого уровня вложенности?

/categ/group1 - 2й уровень - можно

/categ/group1/что угодно - 3й уровень запретить

/categ/group1/что угодно/что угодно2 - 4й уровень запретить

A
На сайте с 16.05.2018
Offline
5
#135

Если подходит вариант заблокировать все страницы содержащие "?lang=ru" используйте:

Disallow: /*?lang=ru*

Если нужно заблокировать только "/lol?lang=ru" используйте:

Disallow: /lol?lang=ru*

я сделал

Disallow: *?lang=ru* без / вначале, роботс говорит что заблокировано, не врёт ведь, верно ?

[Удален]
#136

А что за привычка такая дурная пошла - ставить в конце звездочку?

Б
На сайте с 04.03.2018
Offline
4
#137

Возник вопрос, а каким образом seo специалисты узнают об изменении в поведении поискового робота, только лишь по результатам показателей работы сайта или есть какие-либо публикаци?

салон красоты в Люберцах (http://beautel-salon.ru/)
[Удален]
#138
Бэлла:
Возник вопрос, а каким образом seo специалисты узнают об изменении в поведении поискового робота, только лишь по результатам показателей работы сайта или есть какие-либо публикаци?

Ну:

1. Часто яндекс сам пишет;

2. А когда он пишет или не пишет и все через одну точку - можно определить по количеству страниц в топике об апе.

Это так, что вам доступно.

p.s. причем тут robots.txt?

Б
На сайте с 04.03.2018
Offline
4
#139

Спасибо, я пока мало знаю, возможно вопрос не в ту тему кинула.

T
На сайте с 24.09.2014
Offline
91
#140

Привет!

Такой вопрос: как правильно прописать в файле robots запрет на индексацию страниц вложений wordpress, с учетом того, что страницы у меня имеют ссылки с русскими буквами по типу site.com/публикация-1/

Получается, простым Disallow: /*.html/* не получится сделать запрет, ведь .html по сути нету и у меня получилось, что Яндекс вогнал в индекс много не нужных

РКН: консультации, помощь с разблокированием, работа с конкурентами.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий