Индексирование запретного

Independence
На сайте с 29.10.2005
Offline
428
519

Заметил в логах, что Google проиндексировал 2 .cgi-страницы (это с форума). При этом вся папка /cgi-bin/ у меня закрыта от индексации. Хмм?

Были мысли даже открыть часть (как раз таки форум), но так как без изврата это в htaccess не сделаешь, она вся была закрыта. Вот и как это понимать, понимаешь?

fima32
На сайте с 12.01.2006
Offline
132
#1

А внутренность robots.txt дайте поглядеть?

П
На сайте с 19.04.2005
Offline
104
#2

Если логи показали, что бот лазил по закрытым от индексации страницам, то не факт что он их индексировал.

Или как вы определяли что страници проиндексированы?

Вечные ссылки в рассрочку, отобраны только качественные доноры Регистрация по приглашению -> http://gogettop.ru/?ref=18973 (http://gogettop.ru/?ref=18973)
B
На сайте с 13.11.2002
Offline
89
#3

индексит он запрещённые в роботс страницы... :) и в серп ставит без снипета... а титл формирует из наиболее сильной ссылки на эту страницу...

если хотите избавится от этих страниц, редиректните их 301 куда-нибудь... например на морду... :)

F
На сайте с 20.08.2002
Offline
76
#4

Я обычно вообще паролем закрываю через htaccess. шоб не думалось.

Affiliate programs (http://www.platinumaffiliates.com) - казиношная партнерка под буржуйский трафф
Independence
На сайте с 29.10.2005
Offline
428
#5

robots.txt так выглядит:

User-agent: *

Disallow: /cgi-bin/ # cgi-bin

Disallow: /css/ # css

Пилот, потому что в логах это был Bot Google, который обычно индексурует страницы (за день, кроме cgi, он индексировал и другие, но уже .html-страницы). Поэтому и решил так.

Balabass, Вы, наверное, правы в том, что он зашел по ссылке (на эти адреса ссылки стоят с посторонних сайтов).

П
На сайте с 19.04.2005
Offline
104
#6
Independence:
robots.txt так выглядит:

Пилот, потому что в логах это был Bot Google, который обычно индексурует страницы (за день, кроме cgi, он индексировал и другие, но уже .html-страницы). Поэтому и решил так.

Balabass, Вы, наверное, правы в том, что он зашел по ссылке (на эти адреса ссылки стоят с посторонних сайтов).

Все правильно, бот зашел, зашел как правило по ссылке, иначе как бы он узнал об этих страницах, но не факт, что он зятянул эти страници в индекс, просто теперь гуглу известны адреса этих страниц, вот и все. И по запросу site: он будет отображать только лишь адреса этих страниц.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий