Может ли Яндекс индексировать страницы, закрытые роботсом?

pelvis
На сайте с 01.09.2005
Offline
345
451

Прошу прощения за ньюбовский вопрос, но тем не менее. Я читал, что есть особенность у роботов в том, что они индексируют заполненные формы. Затем за это могут последовать санкции.

Есть у меня клиентский сайт, у которого за счет модреврайта эти самые формы вынесены в определенный раздел, который собственно и закрыт Disallow: /дирректория/

Но каким-то волшебным образом часть страниц проиндексировалась.

Я могу передавать заказы разными способами, в том числе и Post и GET , но передаю заказ ссылкой, что мне удобно с точки зрения программинга.

Вопрос в том, что можно закрыть эти ссылки программно, но это будет уже клоакинг.

И как поступить? И могут ли быть санкции за то, что робот-сборщик прошел по данным страницам в обход правила robots.txt?

пс: если подобная тема была, то приношу извинения.

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
AVV
На сайте с 31.07.2006
Offline
84
AVV
#1

Вот тут почитайте, как закрыть программно, недавно была тема:

/ru/forum/152514

Поскольку вы программист, то разберетесь, как чуть-чуть подправить RewriteRule

Не будет клоакинг.

pelvis:
И могут ли быть санкции за то, что робот-сборщик прошел по данным страницам в обход правила robots.txt?

Насколько я знаю, стандарт исключений для роботов, всего лишь рекомендации для поисковиков, а не приказ. Может быть, ошибаюсь. Не буду категоричным.

F
На сайте с 28.04.2005
Offline
51
#2

Вчера то же самое заметил у себя - яндекс ходит по страницам, явно закрытым в robots.txt.

Вот тут описывается такой же случай.

Суть в том, что яндекс кеширует robots.txt. Но в моем случае, получается, что время кеширования уже составляет больше месяца, т.к. именно месяц назад я произвел соответствующие изменения в robots.txt.

pelvis
На сайте с 01.09.2005
Offline
345
#3

Fordik, речь о новом сайте :) У которого проиндексировались запрещенные страницы, и ни одной другой в индекс не попало.

То есть с точностью до наоборот.AVV, спасибо, но проще переделать на передачу методом пост, что я и сделаю.

AVV
На сайте с 31.07.2006
Offline
84
AVV
#4
Fordik:
Суть в том, что яндекс кеширует robots.txt.

Абсолютно верно. И не только Яндекс, Рама тоже кеширует. На счет других, не обращал внимания.

MSN, вроде как не кеширует. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий