Как закрыть ссылки от поискового робота?

H
На сайте с 25.07.2007
Offline
8
644

Проблема в следующем.

Сайт представляет собой несколько каталогов, в каждом каталоге есть возможность сортировки, которая сделана, как ссылки.

например:

http://сайт.ru/каталог/?&order=date&desc=0

а так же есть отоборы, например, по типу:

http://сайт.ru/каталог/?order=date&desc=0&p_type=1

отборов по нескольким признакам, так же есть отбор по рубрике и т.д.

http://сайт.ru/каталог/?order=date&desc=0&p_type=1&rubric=76

Таким образом, если сложить все отборы, рубрики, сортировки, страницы получается немыслемое кол-во страниц.

Поисковый робот просто запутывается на сайте, и до основного контента не доходит.

Что делать?

1. Поставил все отборы в тег <noindex>. Но что будет с теми страницами, которые уже попали в индексации, т.е. их яндекс будет заново смотреть, так как is-last-modified выдают текущее дату и время. И ссылки, которые <noindex> попадают в индексацию или просто не учитывается текст внутри этого тега?

2. Может сделать так, что если включен какой-нибудь отбор или сотрировка, то включать мета тег <meta name="robots" content="noindex, nofollow">. Понимает ли это яндекс?

3. Может можно как-то с помощью robot.txt, но там я так понимаю, можно закрыть только каталог?

T
На сайте с 11.08.2005
Offline
181
#1
harleq:

2. Может сделать так, что если включен какой-нибудь отбор или сотрировка, то включать мета тег <meta name="robots" content="noindex, nofollow">. Понимает ли это яндекс?

Этого будет вполне достаточно.

Dmitry V___v
На сайте с 07.12.2006
Offline
308
#2
harleq:

1. Поставил все отборы в тег <noindex>. Но что будет с теми страницами, которые уже попали в индексации, т.е. их яндекс будет заново смотреть, так как is-last-modified выдают текущее дату и время. И ссылки, которые <noindex> попадают в индексацию или просто не учитывается текст внутри этого тега?

Должен не учитываться ни текст, ни ссылка. На практике моей - 2 раза учитывал в течение 3-4х апов :) (Дата индексации страницы обновлялась) Потом, правда, исправился :)

А Вам прямо таки надо обязательно выкинуть страницы дубли из индекса? ;) Я конечно понимаю все про "соглашение" Яндекса, но... В итоге сам ведь всё поклеит :) Так что я бы ссылки скрыл, а страницы оставил бы.

2. Может сделать так, что если включен какой-нибудь отбор или сотрировка, то включать мета тег <meta name="robots" content="noindex, nofollow">. Понимает ли это яндекс?

Да. Как ответили Вам выше, этого достаточно, чтобы закрыть страницу от индексации целиком.

3. Может можно как-то с помощью robot.txt, но там я так понимаю, можно закрыть только каталог?

Можно и не только каталог. Подробнее - robotstxt.org, если мне память не изменяет.

Создание и ведение кампаний Google/Bing/Twitter/FB Ads под USA, Canada, United Kingdom and Australia ( https://searchengines.guru/ru/forum/1028286 ) + жирный линкбилдинг под бурж ( https://searchengines.guru/ru/forum/1028282 )
H
На сайте с 25.07.2007
Offline
8
#3

а где можно прочитать подробнее про <meta name="robots"

Dmitry V___v
На сайте с 07.12.2006
Offline
308
#4
harleq:
а где можно прочитать подробнее про <meta name="robots"

Где-то здесь встречал http://www.w3.org/Consortium/siteindex раньше.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий