Как правильно закрыть дубли..????

12
winzoro
На сайте с 20.02.2009
Offline
37
852

вопрос в следующем, подскажите кто знает....

пытаюсь закрыть дубли страниц с помощью "robots.txt" и столкнулся с такой проблемой:

http://мой_сайт/2012/
http://мой_сайт/

--получается дубль и по идеи легко закрывается:

Disallow: /201*/

--Но проблема в том что страницы с материалами выглядят так:

http://мой_сайт/2012/12/24/evangelionicons1-0.html

--и соответственно закрывая "Disallow: /201*/" закрываю нужный контент ......

Посоветуйте как и что лучше сделать .?????

Sveta Prokopeva
На сайте с 10.05.2006
Offline
99
#1

Такое решение не подойдёт?

Allow: /2012/12/24/evangelionicons1-0.html 
Allow: /2012/12/23/evangelionicons1-0.html
Dissallow: /201*/
дани мапов
На сайте с 06.09.2012
Offline
204
#2

Можно использовать спецсимвол '$', например:

Disallow: /2012/$

# запрещает '/2012/',

# но не запрещает 'httр://мой_сайт/2012/12/24/evangelionicons1-0.html'

Написание и доработка скриптов (PHP, MySQL, JavaScript, jQuery) (/ru/forum/811046)
winzoro
На сайте с 20.02.2009
Offline
37
#3
дани мапов:
Можно использовать спецсимвол '$', например:

Disallow: /2012/$

# запрещает '/2012/',
# но не запрещает 'httр://мой_сайт/2012/12/24/evangelionicons1-0.html'

Спасибо .... думал об этом но не был уверен

---------- Добавлено 26.09.2013 в 16:01 ----------

Sveta Prokopeva:
Такое решение не подойдёт?

Allow: /2012/12/24/evangelionicons1-0.html 

Allow: /2012/12/23/evangelionicons1-0.html
Dissallow: /201*/

Такое решение не подойдёт, таких страниц много и все они разные, так что разрешать каждую в "robots.txt" физически невозможно, их не одна тысяча

winzoro
На сайте с 20.02.2009
Offline
37
#4

Продолжение вопроса :)

Как ПРАВИЛЬНО разрешить:

http://мой_сайт/gadgets/

и запретить :

http://мой_сайт/gadgets/gadgets_games1/
http://мой_сайт/gadgets/gadgets_games2/
http://мой_сайт/gadgets/gadgets_games5/

.....

дани мапов
На сайте с 06.09.2012
Offline
204
#5

Думаю так можно, на всякий случай проверьте в Яндекс вебмастере:

Disallow: /gadgets/gadgets_games*/$

winzoro
На сайте с 20.02.2009
Offline
37
#6
дани мапов:
Думаю так можно, на всякий случай проверьте в Яндекс вебмастере:

Disallow: /gadgets/gadgets_games*/$

К сожалению не подойдет.

Наверное я не точно сформулировал вопрос, таких страниц МНОГО и они все РАЗНЫЕ, типа:

http://мой_сайт/gadgets/gadgets_games1/
http://мой_сайт/gadgets/guter/
http://мой_сайт/gadgets/mitter/

....

Возможна ли такая конструкция..??


http://мой_сайт/gadgets$/*

дани мапов
На сайте с 06.09.2012
Offline
204
#7

Тогда через robots.txt не получится, можно в движке выдавать метатег "robots".

winzoro
На сайте с 20.02.2009
Offline
37
#8

Тогда следующий вопрос ...

Как правильно метатег составить и имеет ли значение на каком движке сайт???

дани мапов
На сайте с 06.09.2012
Offline
204
#9
winzoro:
Тогда следующий вопрос ...
Как правильно метатег составить и имеет ли значение на каком движке сайт???

Конечно, все зависит от движка и от того, что надо закрывать от индексации. Проверяете например, находимся ли мы в нужном разделе-категории и если да - вставляем в блок метатегов <meta name="robots" content="noindex,nofollow" />.

G-and-Y
На сайте с 29.06.2013
Offline
156
#10
Абузо-устойчивые впс в Нидерландах от 5$/мес (https://cp.inferno.name/aff.php?aff=2991)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий