Подскажите по robots.txt

12
D
На сайте с 29.06.2010
Offline
64
730

есть вот допустим url - http://site.com/slon и есть дубль http://site.com/slon123

Подскажите, пожалуйста, как правильно закрыть /slon123 в robots, чтоб ничего лишнего не зацепить?

Спасибо.

Станки для лазерной резки фанеры, пластика, дерева, металла (http://lasergu.ru/katalog-category/stanki-dlya-lazernoy-rezki/)
KO
На сайте с 16.09.2010
Offline
21
#1

User-agent: *

Disallow: /slon123/

A
На сайте с 09.09.2008
Offline
156
#2

User-agent: *

Disallow: /slon123$

или

User-agent: *

Disallow: /slon123

Disallow: /slon123/

Имхо, такое правило не закроет от индексации /slon123

Рекомендую хостинг Бегет: https://surl.li/ceykjl
D
На сайте с 29.06.2010
Offline
64
#3

даже поточнее вот:

http://site.com/slon?view=123

так же встречается на других страницах это ?view=123 :

http://site.com/?view=123

http://site.com/uslugi?view=123

http://site.com/contacts?view=123

То есть, как мне закрыть именно вот эти ?view=123, чтоб с /uslugi

/contacts и тд все норм было?

A
На сайте с 09.09.2008
Offline
156
#4

dimazu, можете так:

User-agent: *

Disallow: /?view=123$

AC
На сайте с 11.02.2010
Offline
58
#5
dimazu:
есть вот допустим url - http://site.com/slon и есть дубль http://site.com/slon123
Подскажите, пожалуйста, как правильно закрыть /slon123 в robots, чтоб ничего лишнего не зацепить?
Спасибо.

Если без дубля никак не обойтись, тогда возможно лучше использовать 301 редирект в htaccess ?

KO
На сайте с 16.09.2010
Offline
21
#6
Arseo:
User-agent: *
Disallow: /slon123$
или
User-agent: *
Disallow: /slon123
Имхо, такое правило не закроет от индексации /slon123

Со слешем на конце мы даём понять ПС что это папка а не файл. И если ТС-у нужно закрыть папку то моё решение правильное.

P.S. Вот для примера http://www.google.ru/robots.txt

K
На сайте с 31.01.2001
Offline
737
#7
Kurkov.ORG:
Со слешем на конце мы даём понять ПС что это папка а не файл.

Kurkov.ORG, не надо пытаться усложнить простую вещь, от этого она перестанет работать.

ТС совершенно ясно написал адрес без всякого слеша на конце:

dimazu:
есть дубль http://site.com/slon123

Поэтому ваша директива

Disallow: /slon123/

не запрещает индексацию этого урла. Папка-не папка, ничего про это в стандарте не написано.

Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved.

/slon123/ - не является частью урла http://site.com/slon123 , хоть убейтесь.

Штудируйте первоисточники, они рулят.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
D
На сайте с 29.06.2010
Offline
64
#8

Всем спасибо.

Kost, так как мне избавиться от этих дублей с ?view=123

ваше мнение интересно.

KO
На сайте с 16.09.2010
Offline
21
#9
Kost:
не запрещает индексацию этого урла.

Чушь несёте. Ещё как запрещает. Посмотрите сами http://webmaster.yandex.ru/robots.xml

S
На сайте с 28.10.2005
Offline
319
#10

Не, не запрещает

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий