Гугл проиндексировал страницы раздела, закрытого от индексации

AP

151

ArtPresident

3 июля 2012, 14:23

813

Есть сайт. Robots.txt сайта выглядит следующим образом:

# robots.txt for http://site.com

User-agent: *

Disallow: /cgi-bin/

Disallow: /admin/

Disallow: /import/

Disallow: /include/

Disallow: /modules/

Disallow: /sys/

Disallow: /order/

Disallow: /order.php

Disallow: /comparison/

Disallow: /registration/

Host: www.site.com

Sitemap: http://www.site.com/sitemap.xml

Как в индекс попали страницы раздела и сам раздел site.com/order/ ?

По запросу site:site.com/order/ гугл выдает как сам раздел, так и страницы раздела с параметрами вида site.com/order/?бла-бла-бла

Где ошибка?

E

283

easywind

3 июля 2012, 17:48

#1

ArtPresident, они попали до вставки в роботс. (предположительно) как советуют гугловцы удалите из роботс эту строчку, вставьте на страницу ноиндекс робот зайдет увидит команду и они уйдут из выдачи.

591

september

3 июля 2012, 18:14

#2

ArtPresident, они попали до вставки в роботс. (предположительно)

Нет, просто гугл считает роботс скорее рекомендацией, чем правилом. А так индексирует все подряд.

$ карта для вывода вебмани в любой точке мира (https://www.epayments.com/registration?p=dc2462e885)

E

283

easywind

3 июля 2012, 18:39

#3

september, гугле бот не считает роботс рекомендацией. Он его слушает полностью. Но если страницы проиндексировались то их нужно уже удалять.

S

18

starokonka

3 июля 2012, 18:54

#4

Лично я устал уже удалять из индекса запрещенные страницы, задрал он уже индексировать их. В роботс указано что нельзя, на странице указано noindex,nofolow, в панели веб мастера тоже указано что нельзя и один хрен индексирует только поудаляю через день два опять все загоняет, и самое интересное когда беру эту ссылку и панели веб мастера вставляю посмотреть как гугл бот он мне пишет что нельзя, запрещено. Вот и спрашивается, какого фига он их индексирует???

Мой сайт (http://www.remstroy.od.ua)

E

283

easywind

3 июля 2012, 19:17

#5

starokonka, читайте внимательно мой первый пост.

[Удален]

4 июля 2012, 13:47

#6

Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс. В результате URL страницы, а также другие общедоступные сведения, например текст ссылок на сайт или заголовок из каталога Open Directory Project (www.dmoz.org), могут появиться в результатах поиска Google.

Чтобы полностью исключить вероятность появления контента страницы в индексе Google, даже если на нее ссылаются другие сайты, используйте метатег noindex или x-robots-tag. По мере сканирования страниц, робот Googlebot обнаружит метатег noindex и не станет отображать страницу в индексе. HTTP-заголовок x-robots-tag рекомендуется использовать, чтобы исключить из индекса файлы, формат которых отличается от HTML (например, изображения или другие типы документов).

http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=156449

83

medexpert

4 июля 2012, 14:09

#7

1. Ставим пользователю куки - как маркер.

2. Перед обращением к закрытому разделу - проверяем поддержку куки и если нет, говорим "Включите ...".

3. В закрытом разделе на каждой странице проверяем наличие маркера. Если нет --> 404

... скорее 403

"... Нет того веселья: Или куришь натощак, Или пьёшь с похмелья."

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Google: E-E-A-T не является фактором ранжирования