Гугл игнорирует robots?

166

zaxavar

25 апреля 2014, 12:21

803

Здравствуйте!

Перед тем, как открыть сайт для индексации, указал директиву в robots.txt:

Disallow: /*tag*

Сегодня обнаружил, что в индексе гугла страницы вида:

razdel/category/tag/test

Что я не так сделал?

Спасибо.

ВМЕСТО или ВМЕСТЕ с ADSENE - ADSTERRA - https://publishers.adsterra.com/referral/wf8uqXSYuu Раcскажу, подскажу.

S6

158

SEO

25 апреля 2014, 12:27

#1

Для нее сформирован нормальный сниппет или "описание веб-страницы недоступно бла бла бла"?

Если второе - так это нормальная ситуация для гугла, эти страницы не участвуют в выдаче по общим запросам.

Если первое - сколько времени прошло? Время лечит.

Ну, и плюс нельзя исключать капризы гугла, роботс - всего лишь рекомендация для него. :)

Аудит сайта. Консультации.

166

zaxavar

25 апреля 2014, 12:45

#2

Да, верно, пишет:

A description for this result is not available because of this site's robots.txt – learn more.

Но гугл показывает что "такое-то" страниц в индексе

Хотя в реальности, их гораздо меньше. Число сформировалось за счет обилия тегов.

Просто где-то читал, желательно, чтобы кол-во страниц в яндексе и гугле совпадало.

Так вот у гугла их всегда больше, за счет таких вот вариантов...

262

overnight

25 апреля 2014, 14:13

#3

Всё игнорирует, на всё ему плевать.

Что делать?

1. Не создавать мусорные страницы.

2. https://www.google.com/webmasters/tools/home?hl=ru - тут есть инструмент удаления урлов.

3. https://www.google.com/webmasters/tools/home?hl=ru - тут есть инструмент для управления URL с параметрами.

4. Использовать:

X-Robots-Tag: noindex, nofollow

5. Сделать сайтмэп.

6. Поискать советов тут: http://goo.gl/kw0Uj2

zaxavar:
Просто где-то читал, желательно, чтобы кол-во страниц в яндексе и гугле совпадало.

Ну и сейчас я Вас спасу. Читайте:

Количество страниц в индексе Яндекс и Гугл не должно совпадать.

Теперь Вы прочитали совершенно иное и страшное сеошное заклятие снято. Теперь Вы опять будете спокойно засыпать и хорошо кушать. С Вас 100$.

CMS для потрала с Удаление get-параметров из URL 15 частых проблем технического

166

zaxavar

26 апреля 2014, 15:04

#4

overnight, дело в том, что специально мусорные страницы не создаются.

Например страницы типа "Контакты", "Правила" и т.д. - закрыты в robots, но ведь и без них никуда.

А что касается тегов - так это вообще чуть ли не ключевой инструмент фильтрации по материалам.

Но тут по подробнее.

Как ведет себя гугл с этой директивой Disallow: /*tag* - я описал.

Если я добавлю на страницы тегов это

X-Robots-Tag: noindex, nofollow

Что-то поменяется?

262

overnight

26 апреля 2014, 16:54

#5

zaxavar:
Что-то поменяется?

Выкинет.

..

166

zaxavar

26 апреля 2014, 18:17

#6

Отлично, спасибо.

А можно как-то в роботс задать для конкретной страницы

X-Robots-Tag: noindex, nofollow

Объясню почему спрашиваю. Многие страницы выводятся шаблоном. Если для шаблонов страниц тегов еще можно указать прямо в шаблоне, то для других страниц (материалов) нет.

Б

131

Барышников

27 апреля 2014, 05:51

#7

SEO66:
роботс - всего лишь рекомендация для него. :)

И не только для Гугла. У меня уже три месяца для всего сайта висит disallow/ - а по НЧ в Яндексе сайт на первом месте. Хотя и без сниппета.

копирайтинг по технике, аудит, курсы SEO

1076

Mik Foxi

27 апреля 2014, 06:38

#8

overnight:

Количество страниц в индексе Яндекс и Гугл не должно совпадать.

оно должно совпадать. или быть примерно одинаковым. если есть большая разница - значит или где-то наиндексировалось говна или где-то что-то не индексируется и нужно принимать меры.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.

166

zaxavar

27 апреля 2014, 08:15

#9

foxi:
оно должно совпадать. или быть примерно одинаковым. если есть большая разница - значит или где-то наиндексировалось говна или где-то что-то не индексируется и нужно принимать меры.

Я же вот тоже про такое читал, поэтому и спрашиваю.

P

44

profoto

27 апреля 2014, 09:37

#10

zaxavar:
Здравствуйте!
Перед тем, как открыть сайт для индексации, указал директиву в robots.txt:
Код:
Disallow: /*tag*
Сегодня обнаружил, что в индексе гугла страницы вида:

razdel/category/tag/test

Что я не так сделал?
Спасибо.

Не так составили правило, нужно так:

Disallow: */tag/*

С Вас 99$ ))

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Все что нужно знать о DDоS-атаках грамотному менеджеру