Как в гугл попали страницы закрытые в роботс?

0

vados_dp

26 января 2014, 16:50

502

Всем доброго времени суток. Такая тема. Есть молодой сайт (ДЛЕ), в котором с самого начала в robots.txt закрыты страницы типа page/2 и тд. Но в поиске они все равно есть. Кто может подсказать в чем проблема? В роботс прописано так:

Disallow: /page/

Disallow: */page/*

GC

159

GKC

26 января 2014, 16:55

#1

1) зачем вторая строка?

2) ИМХО, оба неверны, я сделал так:

User-agent: *

Crawl-delay: 10

# Directories

Disallow: /includes/

Disallow: /misc/

И все равно гугл может найти, а может пометку "запрещено к индексации высветить" - произвол у них там )

Автоматическое удаление информации (http://www.gkclab.com/russ/terminator/terminator.html) ... Мистический туризм (http://mystictourism.com/) в гости к призракам...

Все вопросы по robots.txt директива Host в яндексе Help - robot.txt

VD

0

vados_dp

26 января 2014, 17:07

#2

GKC:
1) зачем вторая строка?
2) ИМХО, оба неверны, я сделал так:

User-agent: *
Crawl-delay: 10
# Directories
Disallow: /includes/
Disallow: /misc/

И все равно гугл может найти, а может пометку "запрещено к индексации высветить" - произвол у них там )

Спасибо, попробую=) Можно еще вопрос?=)

DL

86

DjekLondon

26 января 2014, 17:23

#3

robots.txt - это фйл с рекомендациями, а не с обязательными правилами индексации.

вот мета тег Noindex обязателен

Я.Директ, G.Adwords - аудит, настройка, ведение. РК в MyTarget, Facebook. Настройка сквозной веб-аналитки, Power BI. Связь - в ЛС, FB - https://www.facebook.com/pavel2322 (https://www.facebook.com/pavel2322)

VD

0

vados_dp

26 января 2014, 17:31

#4

DjekLondon:
robots.txt - это фйл с рекомендациями, а не с обязательными правилами индексации.
вот мета тег Noindex обязателен

Всем спасибо. Короче курить мне еще и курить ету тему=)

427

siv1987

27 января 2014, 11:45

#5

GKC:
2) ИМХО, оба неверны, я сделал так:

И чем же они неверны? И чем же ваши "верные" для ТС-а? Тоже самое что сказать, у вас тоже не верно, я сделал вот так

User-agent: *

Disallow: /

Оба запрета верные, но с некоторыми отличиями - первый запрещает /page/ только от корня сайта, второй запрещает все страницы с вхождение /page/ это в частности относится к страницам категорий site.ru/category/page/2/

Но как уже говорили выше, гугл может их добавить в индекс с пометкой "запрещен к индексации". Либо же запрет в роботс был добавлен после того как бот проиндексировал страницы, либо же эти запреты не срабатывают для бота (не под тем юзер-агентом прописаны, и тд)

Спрашиваем и отвечаем по Всё тот же robots.txt Как правильно склеить домены?

Google: E-E-A-T не является фактором ранжирования

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы