Подскажите как убрать из индекса кое-какие страницы.

12
M
На сайте с 10.05.2011
Offline
41
664

Всем привет, есть сайт на движке oscommerce , хочу составить карту сайта в программе A1 Sitemap Generator, но к каждому товару есть страничка с отзывами, хочу её убрать, программа не хочет пропускать эти странички, такое впечатление что она вообще не учитывает robots.txt

ПРимер моей обычной страницы товара

мой_домен/alpine-ixa-w407bt-p-712.html

и ещё плюс к каждой такой странице вот такую индексирует

мой_домен/alpine-ixa-w407bt-pr-712.html

Выделил жирным разницу, как убрать последнюю из индекса?

Нашол подобную тему про 3ю версию, но там совсем подругому. Выручайте, буду благодарен.

Dwarfik
На сайте с 11.10.2008
Offline
152
#1

В robots.txt закрыть от индексации

мой_домен/alpine-ixa-w407bt-pr

6 тип эннеаграммы
S
На сайте с 28.10.2005
Offline
319
#2

User-agent: *

Disallow: /alpine-ixa-w407bt-pr

Nanaki
На сайте с 24.08.2010
Offline
28
#3

Так же если я не ошибаюсь можно прописать в <head> <link rel="canonical" href="мой_домен/alpine-ixa-w407bt-p-712.html"> на всех дублях, указывая основную страницу, тогда только они будут участвовать в поиске. По идее этот метод может быть действеннее чем Robots.txt

…Время проведенное на рыбалке в счет жизни не засчитывается… Леонид Павлович Сабанеев.
Aliasst
На сайте с 29.10.2010
Offline
44
#4

в роботсе прописать:

Disallow: *pr*

тогда все страницы с "pr" не будут индексироваться. Это для того чтобы не прописывать каждую страницу с комментариями.

Выкупаем баннерные показы выгодно - тут (http://wizard-banners.com/?ref=aliasst)
Dwarfik
На сайте с 11.10.2008
Offline
152
#5
Aliasst:
в роботсе прописать:
Disallow: *pr*

тогда все страницы с "pr" не будут индексироваться. Это для того чтобы не прописывать каждую страницу с комментариями.

В этом случае придётся следить за тем, чтобы в названии статьи/раздела/категории/рубрики не встречалось сочетание "pr". Так что такой обобщённый вариант не очень)))

Думаю, что из наших подсказок ТС сможет выбрать оптимальный вариант. Мы же не знаем структуру его сайта))

azartan
На сайте с 25.11.2010
Offline
67
#6

может редирект получится сделать со страниц р на pr

Мониторинг обменников - выгодный обмен электронных денег и криптовалют (https://okku.ru) * Сайт о домашних питомцах - вопросы, ответы, объявления (http://zhizo.ru)
Dwarfik
На сайте с 11.10.2008
Offline
152
#7
azartan:
может редирект получится сделать со страниц р на pr

Глупость!

Чтобы страница выпала из индекса, желательно, чтобы она возвращала 404...

Aliasst
На сайте с 29.10.2010
Offline
44
#8
Dwarfik:
В этом случае придётся следить за тем, чтобы в названии статьи/раздела/категории/рубрики не встречалось сочетание "pr". Так что такой обобщённый вариант не очень)))
Думаю, что из наших подсказок ТС сможет выбрать оптимальный вариант. Мы же не знаем структуру его сайта))

ну тогда можно и так:

Disallow: *-pr-*

такое сочетание навряд ли будет встречаться в других страницах

Dwarfik
На сайте с 11.10.2008
Offline
152
#9
Aliasst:
ну тогда можно и так:

Disallow: *-pr-*

такое сочетание навряд ли будет встречаться в других страницах

Уже намного интереснее)) Кстати, последнюю "*" можно не ставить, она какбэ подразумевается.

M
На сайте с 10.05.2011
Offline
41
#10

попробую последний вариант. Кстати, как заставить эту прогу учитывать роботс.тхт? КТо-то пользовался ей? Там есть в настройках галочка "использовать robots.txt если он есть" , её ставлю, для проверки указываю в роботсе "Disallow: /" и всё равно индексирет, подскажите чё делать?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий