Помогите создать robots.txt

I
На сайте с 15.01.2013
Offline
3
938

Здравствуйте уважаемые веб-мастера, помогите правильно сделать robots.txt

Сайт на MODx, сейчас robots.txt такой;

User-agent: *

Disallow: /assets/cache/

Disallow: /assets/docs/

Disallow: /assets/export/

Disallow: /assets/flash/

Disallow: /assets/import/

Disallow: /assets/modules/

Disallow: /assets/plugins/

Disallow: /assets/snippets/

Disallow: /assets/media/

Disallow: /assets/templates/

Disallow: /manager/

Disallow: /css/

Disallow: /other/

Disallow: /share42/

Crawl-delay: 2

Host: enterbel.ru

Sitemap: http://enterbel.ru/sitemap.xml.html

Sitemap: http://enterbel.ru/sitemap.xml

Две ссылки указывают на одну страницу.

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=0

А вот это уже разные страницы.

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=0

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=10

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=20

Кроме того в sitemap.xml нет страниц типа;

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=0

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=10

/catalog/oborudovanie-dlya-magazina/torgovyie-stellazhi-sk-rus/?torgovyie-stellazhi-sk-rus_start=20

Может ли плохо индексироваться из-за этого сайт ? Что посоветуете?

Спасибо за ответ.

sir Nicholas
На сайте с 18.04.2012
Offline
146
#1
igvind:
Может ли плохо индексироваться из-за этого сайт ? Что посоветуете?
Спасибо за ответ.

Индексироваться будет как и был, но индекс будет засорять хлам (дубли), а это влияет на продвижение в ПС.


Disallow: /*.php$
Disallow: /index.php
Disallow: /*?
Disallow: /*&
Disallow: /*%

Закрывает всякий хлам, по крайней мере у меня. В интернете много нормальных статей на эту тему, уделите час-другой для изучения, лучше самому понимать что и как работает, иначе сайт загоните в зрительный зал.

I
На сайте с 15.01.2013
Offline
3
#2

Уже всё облазил, не могу ничего придумать. Нужна помощь спеца.

sir Nicholas
На сайте с 18.04.2012
Offline
146
#3
igvind:
Уже всё облазил, не могу ничего придумать. Нужна помощь спеца.

Сначала не внимательно прочитал Ваш пост. :)

Вам поможет только: rel="canonical"

BO
На сайте с 31.12.2012
Offline
93
#4

а как ни будь так? : Disallow: /*start=0

sir Nicholas
На сайте с 18.04.2012
Offline
146
#5
BiOSila:
а как ни будь так? : Disallow: /*start=0

Так он закроет от индексации постраничную навигацию, тем самым улетит кучу нужных страниц вместе с дублями. В данном случае возможно удаления дублей только через rel="canonical"

I
На сайте с 15.01.2013
Offline
3
#6

Тут всё, как всегда запутанно, я не профи поэтому мне сложно с этим разобраться. Буду читать, спасибо. Гугл медленно но уверенно добавляет страницы в индекс, а яша выкинул все кроме первых во втором уровне.

I
На сайте с 15.01.2013
Offline
3
#7

Добавил в robots.txt Disallow: /*start=0 и проверил, через яндекс вебмастер, ВСЁ ОК!!! То что нужно !!

Остаётся последний вопрос, "нужно добавлять страницы в sitemap.xml с окончанием;

start=0

start=10

start=20

и как это реализовать?"

BO
На сайте с 31.12.2012
Offline
93
#8
igvind:
Добавил в robots.txt Disallow: /*start=0 и проверил, через яндекс вебмастер, ВСЁ ОК!!! То что нужно !!
Остаётся последний вопрос, "нужно добавлять страницы в sitemap.xml с окончанием;
start=0
start=10
start=20

и как это реализовать?"

Проверти, заодно, не грохнули ли вы страницы с окончанием start=10,start=20.

П.С. очень удивило: решил первый раз помочь на форуме, "заминусовали" карму=\

I
На сайте с 15.01.2013
Offline
3
#9

Я проверил в вебмастере start=10, start=20 и тд. доступ к этим страницам разрешен, а вот start=0-доступ запрещён. Проверил постранично, вроде всё ок. Но к моему сожалению это ещё не всё.

Есть страница /catalog/xolodilnoe-oborudovanie/ с неё ридерект на первую страницу раздела /catalog/xolodilnoe-oborudovanie/vitrinyi-xolodilnyie/, так вот эта первая страница раздела не индексируется, а мне нужно всё наоборот.

Дубль страницы /catalog/xolodilnoe-oborudovanie/vitrinyi-xolodilnyie/?vitrinyi-xolodilnyie_start=0 мы, с Вашей помощью перекрыли, а вот как дальше быть? А может она не индексировалась из-за дубля ??? Что скажите?

I
На сайте с 15.01.2013
Offline
3
#10

BiOSila, Спасибо большое, как только поправил robots.txt сразу, через день влетело в индекс 700 страниц, правда ещё снипет на редирикт на первую дочернюю страницу поправил. В целом спасибо.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий