robots.txt и Google или как закрыть страницы от индексации

12
N
На сайте с 20.12.2010
Offline
74
1769

Всем привет!

Расскажу о причине, которая побудила меня создать данную тему.

Рассчитываю на дельный совет от знающих.

Новый сайт, на момент тестирования был закрыть от индексации.

По завершению тестирования добавлен в панель веб-мастера, вместе с sitemap.xml.

Перед добавлением сайта в веб-мастер панель, был залит заранее подготовленный и учитывающий все возможные фильтры, сортировки и проверенный в той же панели robots.txt

Но вот сегодня меня постигло разочарования, когда в дополнительном индексе я увидел все те страницы, которые тщательно хотел уберечь от индексирования, дабы не допустить появления дубликатов.

Это что же получается Google игнорирует инструкции robots.txt, у кого есть какие соображения по этому поводу?

Straifer1
На сайте с 23.05.2007
Offline
164
#1

Nktzz, у меня в роботсе мусор закрыт + в WMT добавлял на удаление, периодически по pr-cy мониторю индексацию, бывает выплюнет ровно то, что под запретом, через несколько часов возвращает. Вот и пойми его...

RK
На сайте с 10.12.2006
Offline
176
#2
Nktzz:
Всем привет!
Расскажу о причине, которая побудила меня создать данную тему.
Рассчитываю на дельный совет от знающих.

Новый сайт, на момент тестирования был закрыть от индексации.
По завершению тестирования добавлен в панель веб-мастера, вместе с sitemap.xml.
Перед добавлением сайта в веб-мастер панель, был залит заранее подготовленный и учитывающий все возможные фильтры, сортировки и проверенный в той же панели robots.txt

Но вот сегодня меня постигло разочарования, когда в дополнительном индексе я увидел все те страницы, которые тщательно хотел уберечь от индексирования, дабы не допустить появления дубликатов.

Это что же получается Google игнорирует инструкции robots.txt, у кого есть какие соображения по этому поводу?

выкладывайте роботс.тхт ваш, и то что вы на самом деле хотите закрыть. может вы в этом роботсе допустили ошибки.

на своем опыте знаю. такое не исключено

Все виды хостинга - https://clck.ru/37EqSV - и не только ...
N
На сайте с 20.12.2010
Offline
74
#3

User-agent: *

Disallow: /index.php?route=

Disallow: /*route=

Disallow: /index.php?_route_=

Disallow: /*?sort=

Disallow: /*&sort=

Disallow: /*?order=

Disallow: /*&order=

Disallow: /*?limit=

Disallow: /*&limit=

Disallow: /admin

Disallow: /catalog

Disallow: /download

Disallow: /export

Disallow: /system

Host: carmusicshop.com.ua

Sitemap: http://carmusicshop.com.ua/sitemap.xml

---------- Добавлено 05.07.2012 в 21:47 ----------

raman-kursk:
выкладывайте роботс.тхт ваш, и то что вы на самом деле хотите закрыть. может вы в этом роботсе допустили ошибки.

на своем опыте знаю. такое не исключено

выложил, посмотрите пожалуйста со стороны

Закрыть хотел страницы вида:

/?sort=p.price&order=DESC

/?limit=0

и т.п.

Aphex
На сайте с 25.07.2006
Offline
127
#4

Замечено в последнее время неоднократно, страницы запрещенные в роботсе пару месяцев успешно ранжируются. Даже панель ВМТ уже не помогает. Сайты хорошо индексируемые, не многостраничные. Достал по полной уже гугля.

Делай только то, что дается тебе легче всего, но делай это изо всех сил.
E
На сайте с 21.09.2009
Offline
283
#5

Nktzz,

Line 5 Disallow: /*?sort=

The "*" wildchar in file names is not supported by (all) the user-agents addressed by this block of code. You should use the wildchar "*" in a block of code exclusively addressed to spiders that support the wildchar (Eg. Googlebot).

Вот что пишет проверка Вашего роботса.

N
На сайте с 20.12.2010
Offline
74
#6
easywind:
Nktzz,
Line 5 Disallow: /*?sort=
The "*" wildchar in file names is not supported by (all) the user-agents addressed by this block of code. You should use the wildchar "*" in a block of code exclusively addressed to spiders that support the wildchar (Eg. Googlebot).
Вот что пишет проверка Вашего роботса.

хм.. это где вы проверяете?

Vladimir SEO
На сайте с 19.10.2011
Online
1955
#7

бывает и такое часто , гугл шалит по полной

Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/
E
На сайте с 21.09.2009
Offline
283
#8

Nktzz, ссылка но лучше в помощи гугла почитайте способ интересней описывается как проверить ссылка

N
На сайте с 20.12.2010
Offline
74
#9

User-agent: *

Disallow: *route=*

Disallow: /*sort=*

Disallow: *order=*

Disallow: /*limit=*

Disallow: /admin

Disallow: /catalog

Disallow: /download

Disallow: /export

Disallow: /system

Host: site.com.ua

Sitemap: http://site.com.ua/sitemap.xml

может привести к такому виду? хотя как по мне это просто упрощение предыдущего варианта...

Aphex
На сайте с 25.07.2006
Offline
127
#10

Nktzz, должны работать как и /*?sort= так и /*sort=*

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий