Как скрыть форум от индексации

vrodeden
На сайте с 12.03.2011
Offline
157
635

Здравствуйте. Хочу задать вопрос по поводу скрытия от индексации части сайта в файле /robots.txt

На моем сайте есть форум. Он существует в обычной, и текстовой версии. На сколько я понимаю, поисковики индексируют оба варианта и получается дубликат контента. Можно ли в файле /robots.txt скрыть текстовую версию форума?

Если можно я приведу пример ссылок на форум, чтобы было понятнее .

http://videochaty.ru/?inc=forum&forum=7&topic=16851 обычный форум

http://videochaty.ru/?inc=forum&archive=html&forum=7&topic=16851 текстовая версия.

Разница в одном слове.

если в файле /robots.txt индексацию запретить нельзя, то может быть существуют какие то альтернативные пути решения? Или может быть в подобном дублировании нет ничего страшного и я зря морочу себе голову?

Буду признателен за любую помощь.

P.S.

я на этом форуме недавно и не знаю можно ли оставлять ссылки в сообщении. Если нельзя , то прошу модераторов просто удалить ссылки, а вопрос оставить. Мне бы хотелось услышать совет людей, которые давно занимаются оптимизацией сайтов.

Видеочат Встречи.su (https://встречи.su) . Онлайн знакомства без регистрации.
aka_Puhh
На сайте с 22.09.2010
Offline
17
#1

Так для начала скажу, не приводя вашу цитату, разница не в слове а в названии переменной урла. Читать "arch=****"Для того чтобы исключить из индекса все страницы с такой пременной необходимо обратится к хелпам яндекса относительно robots.txt, где можно найти ответ на данный вопрос.

vrodeden
На сайте с 12.03.2011
Offline
157
#2

Обратился. Но к сожалению не нашел я где описываются эти переменные. Понял только, как исключить из индексирования полностью определенную папку. Вас бы не затруднило на конкретном примере, приведенном выше написать одно слово. Что нужно написать после

Disallow: Для того чтобы исключить из индексации все странички с переменной &archive=html 😕

nik_kent
На сайте с 05.02.2008
Offline
193
#3

Я чего-то не понимаю? Вот так не подойдет что-ли?

Disallow: /*archive

И проверить не забудьте.

С уважением, Николай.
aka_Puhh
На сайте с 22.09.2010
Offline
17
#4

Вот честно скажу ответил по памяти и когдато видел в хелпаз про переменные и сейсас специально сморел и ненашел, но

nik_kent:
Я чего-то не понимаю? Вот так не подойдет что-ли?
Disallow: /*archive

И проверить не забудьте.

принципе согласен только можно почеловечиски(понятнее) написать

User-agent: *

Disallow: /*archive=*

vrodeden
На сайте с 12.03.2011
Offline
157
#5

Проверил. Насколько я понимаю в этой проверке, ошибки нет. Но остался вопрос при таком способе написания Disallow: /*archive Поисковики исключат из индексации текстовую версию форума? И не скажется ли это негативно на остальном контенте? Крайне не хотелось бы прописывать наугад.

Так как лучше написать?

Disallow: /*archive=*

или

Disallow: /*archive

nik_kent
На сайте с 05.02.2008
Offline
193
#6
vrodeden:
Проверил. Насколько я понимаю в этой проверке, ошибки нет. Но остался вопрос при таком способе написания Disallow: /*archive Поисковики исключат из индексации текстовую версию форума? И не скажется ли это негативно на остальном контенте? Крайне не хотелось бы прописывать наугад.

Они исключат все страницы, в адресе которых содержится "archive".

Вы уверены, что читали хелп по роботсу?

vrodeden
На сайте с 12.03.2011
Offline
157
#7

Читал. Но в вашем коментарии был вопрос и у меня появились сомнения в правильности написания строчки. Большое спасибо, что откликнулись. Значит буду прописывать Disallow: /*archive=*

Если я что то не так понял. не сочтите за труд меня поправить.

nik_kent
На сайте с 05.02.2008
Offline
193
#8
vrodeden:
Читал. Но в вашем коментарии был вопрос и у меня появились сомнения в правильности написания строчки.

Вопрос был, потому что я сомневался, что человек, прочитавший хелп не справился с составлением правила в роботсе. Читайте еще и внимательнее - мой Вам совет.

aka_Puhh:
принципе согласен только можно почеловечиски(понятнее) написать
User-agent: *
Disallow: /*archive=*

По-человечески, никакой разницы. "=" при указанной в первом посте структуре адресов погоды не делает, а "*" в конце всегда подразумевается.

Ну а в принципе, мне пофик - согласны Вы или нет :)

aka_Puhh
На сайте с 22.09.2010
Offline
17
#9
nik_kent:
погоды не делает, а "*" в конце всегда подразумевается.
Ну а в принципе, мне пофик - согласны Вы или нет :)

Да тут всем, по большому счету всё пофиг, а если у вас чтото личное то - ну ладно... я просто предложил тотже вариант только более понятный человеку с первого взгляда, впрочем на хлеб и секс товарищей нет :)

А если ТС хочет еще то могу предложить еще вариант решения вопроса

в начало index.php добавляем такую штуку

<?php
if(!empty($_GET["archive"])){
header("HTTP/1.1 404 Not Found", true, 404);
}
?>

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий