Подскажите по robots.txt

64

dimazu

17 сентября 2010, 06:26

739

есть вот допустим url - http://site.com/slon и есть дубль http://site.com/slon123

Подскажите, пожалуйста, как правильно закрыть /slon123 в robots, чтоб ничего лишнего не зацепить?

Спасибо.

Станки для лазерной резки фанеры, пластика, дерева, металла (http://lasergu.ru/katalog-category/stanki-dlya-lazernoy-rezki/)

KO

21

Kurkov.ORG

17 сентября 2010, 06:28

#1

User-agent: *

Disallow: /slon123/

A

156

Arseo

17 сентября 2010, 06:42

#2

User-agent: *

Disallow: /slon123$

или

User-agent: *

Disallow: /slon123

Disallow: /slon123/

Имхо, такое правило не закроет от индексации /slon123

Рекомендую хостинг Бегет: https://surl.li/ceykjl

D

64

dimazu

17 сентября 2010, 06:49

#3

даже поточнее вот:

http://site.com/slon?view=123

так же встречается на других страницах это ?view=123 :

http://site.com/?view=123

http://site.com/uslugi?view=123

http://site.com/contacts?view=123

То есть, как мне закрыть именно вот эти ?view=123, чтоб с /uslugi

/contacts и тд все норм было?

A

156

Arseo

17 сентября 2010, 07:07

#4

dimazu, можете так:

User-agent: *

Disallow: /?view=123$

AC

58

AndreyChehov

17 сентября 2010, 07:37

#5

dimazu:
есть вот допустим url - http://site.com/slon и есть дубль http://site.com/slon123
Подскажите, пожалуйста, как правильно закрыть /slon123 в robots, чтоб ничего лишнего не зацепить?
Спасибо.

Если без дубля никак не обойтись, тогда возможно лучше использовать 301 редирект в htaccess ?

KO

21

Kurkov.ORG

17 сентября 2010, 07:53

#6

Arseo:
User-agent: *
Disallow: /slon123$
или
User-agent: *
Disallow: /slon123
Имхо, такое правило не закроет от индексации /slon123

Со слешем на конце мы даём понять ПС что это папка а не файл. И если ТС-у нужно закрыть папку то моё решение правильное.

P.S. Вот для примера http://www.google.ru/robots.txt

K

737

Kost

17 сентября 2010, 08:27

#7

Kurkov.ORG:
Со слешем на конце мы даём понять ПС что это папка а не файл.

Kurkov.ORG, не надо пытаться усложнить простую вещь, от этого она перестанет работать.

ТС совершенно ясно написал адрес без всякого слеша на конце:

dimazu:
есть дубль http://site.com/slon123

Поэтому ваша директива

Disallow: /slon123/

не запрещает индексацию этого урла. Папка-не папка, ничего про это в стандарте не написано.

Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved.

/slon123/ - не является частью урла http://site.com/slon123 , хоть убейтесь.

Штудируйте первоисточники, они рулят.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.

Вопрос по robots.txt Маленькая, но очень неприятная Помогите с robots.txt

D

64

dimazu

17 сентября 2010, 08:42

#8

Всем спасибо.

Kost, так как мне избавиться от этих дублей с ?view=123

ваше мнение интересно.

KO

21

Kurkov.ORG

17 сентября 2010, 08:46

#9

Kost:
не запрещает индексацию этого урла.

Чушь несёте. Ещё как запрещает. Посмотрите сами http://webmaster.yandex.ru/robots.xml

S

320

semenov

17 сентября 2010, 08:53

#10

Не, не запрещает

Курс биткоина превысил $50 тысяч

Что такое Power BI и зачем это нужно бизнесу