Гугл индексирует запрещенные директории?!

AG

139

Alex GT

5 февраля 2006, 21:02

1410

У меня возможно дилетантский вопрос, но это проблемка.

У меня файле robots.txt написан запрет для индексации пары папок для баннеров и редиректов.

Почему они появились в индексе гугла????

Или я неправильно написал роботс?

User-Agent: *
Disallow: /advbanner
Disallow: /go

Good Luck

W

200

whiteman

5 февраля 2006, 21:22

#1

Alex GT, пора подавать иск :d

S

332

svift

5 февраля 2006, 21:45

#2

Почему они появились в индексе гугла????

А что именно появилось в индексе? Кеш есть? Или только урлы? Если урлы, то это обычная картина, а вот если еще и кеширует, то надо смотреть более пристально

Не все ссылки одинаково полезны ( https://www.svift.org/ ). Тут заказываю комментарии и отзывы ( https://qcomment.ru/ref/5651 ) для своих сайтов

AG

139

Alex GT

5 февраля 2006, 22:00

#3

2 svift

проблема в том, что в индексе гугла появились странички с редиректами. Они не содержат контента, только тупой редирект в мета теге. поэтому сказать, что это, просто урлы или кэш не могу.

Проблемка в том, что ведь мета редирект сильно не любят поисковики и гугл в частности.

Не повлияет ли это на мою основную часть сайта?

Хотя, хотя по логам, робот на эти страницы вроде бы не заходит. Хотя, на парочку зашел.

112

mustofik

5 февраля 2006, 23:48

#4

ИМХО Гугля начинается проявлять игнор к Robots.txt

была замечена похожая трабла...

S

332

svift

6 февраля 2006, 00:18

#5

Alex GT, да смысл в том, что можно закрыть директории/файлы файлом robots.txt, можно поставить на ссылки rel=nofollow - но Google будет заносить запрещенные урлы в базу, однако ни кеша у таких адресов не будет, ни в выдаче их не встретишь... то есть то что по запросу site:domen.com Google выдает кучу запрещенных урлов без снипета - это не такая уж страшная беда... надо просто принять это как факт и не парится... у меня такое было, когда определенные служебные урлы были закрыты в robots.txt + ссылки на них если и были, то были с nofollow - но Гугля их упорно съела, однако в выдаче их нет и картину они не портят...

321

Revan

6 февраля 2006, 01:48

#6

Но тем не менее автоматические пауки обязаны (причем насколько я слышал, не 100% что правда, но именно обязаны) слушаться robots.txt. Ну, в реале то понятно, что просто умный очень и с черными оптимизатоарми так борется. %)

Так вот писались на них абузы пару раз - пишут, что извиняются за ошибку скрипта и что больше не повторится. :)

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.

L

24

lika

6 февраля 2006, 07:41

#7

Alex GT, выводов делать не буду, опишу факт.

На крупном сайте две недели стоял robots.txt полностью запрещающий индексацю. Трафик с Гугля (ок. 300 чел/день) не уменьшился. Гугль индексировал сайт каждый день.

1183

wolf

6 февраля 2006, 08:00

#8

Revan:
Но тем не менее автоматические пауки обязаны (причем насколько я слышал, не 100% что правда, но именно обязаны) слушаться robots.txt. Ну, в реале то понятно, что просто умный очень и с черными оптимизатоарми так борется. %)

А не факт, что роботы его не слушаются. Файл запрещает обращение к документам, но Гугль часто публикует их URL'ы и может даже неплохо ранжировать благодаря ссылочному. Использовать ведь информацию о внешних ссылках на документ файл robots.txt ведь не запрещает.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

L

24

lika

6 февраля 2006, 08:21

#9

wolf:
А не факт, что роботы его не слушаются. Файл запрещает обращение к документам, но Гугль часто публикует их URL'ы и может даже неплохо ранжировать благодаря ссылочному. Использовать ведь информацию о внешних ссылках на документ файл robots.txt ведь не запрещает.

Конкретно в моем случае это, скорее всего, не так - весь трафик идет по низкочастотникам, в тексте ссылок они наверняка нигде не упоминаются.

Может быть, Гуглю нужно больше времени (например, месяц), чтобы начать выполнять директиву robots.txt?

1183

wolf

6 февраля 2006, 08:33

#10

lika:
Может быть, Гуглю нажно больше времени (например, месяц), чтобы начать выполнять директиву robots.txt?

А вы поглядите на даты кешей этих страниц - наверняка они посещались роботом еще до появления запрещающих директив

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах