Яндекс ходит по запрещенным страницам

123 4
ВC
На сайте с 02.02.2006
Offline
463
3648

На сайте стоит аналитическая система, которая контролирует посещение страниц роботами. И по ней видно, что Яндекс посещал и страницы, запрещенные к индексации в robots.txt, и те страницы, в которых прописано

<META NAME="ROBOTS" CONTENT="NOINDEX">
, и даже те файлы, которые вызываются через
<script src="file.js"></script>

В поисковой выдаче ничего этого нет, а вот смотреть их робот всё же смотрит.

Это действительно так или аналитика ошибается?

В особенности интересно, смотрит ли робот файлы, подключаемые через script.

di_max
На сайте с 27.12.2006
Offline
262
#1

Эт с каких пор

<META NAME="ROBOTS" CONTENT="NOINDEX">

запрещает боту скачивать страницу?😮

И скрипты, не закрытые в роботс.тхт, кто мешает скачивать?

Учи матчасть.

// Все наши проблемы от нашего не знания...
A
На сайте с 08.05.2008
Offline
49
#2
Владимир-C:
На сайте стоит аналитическая система, которая контролирует посещение страниц роботами. И по ней видно, что Яндекс посещал и страницы, запрещенные к индексации в robots.txt, и те страницы, в которых прописано
<META NAME="ROBOTS" CONTENT="NOINDEX">

😮

А как Вы думаете, как робот узнает, что на странице meta robots noindex, не зайдя на эту страницу?

I
На сайте с 30.10.2011
Offline
15
#3

Файл robots.txt выполняет следующие функции:

- указание главного зеркала,

- исключение лишних страниц из индекса,

- отказ в индексации нежелательным роботам,

- указание адреса карты сайта.

Исключение страницы из индекса - это просто означает, что страницы не будет в индексе, а не то, что на неё запрещено переходить.

Насколько я понимаю эти правила.

di_max
На сайте с 27.12.2006
Offline
262
#4
instigatorseo:
Насколько я понимаю эти правила.

Правила нужно не только чтить, но и читать. До просветления.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#5

ТС, по секретному секрету скажу, что robots.txt, например, для Яндекса вообще не указ. Захочет - проиндексирует, не захочет не проиндексирует.

Яндекс не просто лжив, он еще и туп.

Если не хотите попасть под удар - не размещайте инфу в инете до тех пор, пока не будете готовы ее предоставить общественности (или алгоритмам)

Пустота. Какого черта здесь появляется чья-то реклама?
Seo-Seo
На сайте с 05.12.2006
Offline
292
#6
Владимир-C:
что Яндекс посещал и страницы, запрещенные к индексации в robots.txt

Я больше скажу - если на эту страницу стоят ссылки, они могут даже в выдаче быть, а не просто посещаться. Хотите гарантий - закрывайте программно.

---------- Добавлено 08.03.2012 в 13:51 ----------

Shlackbaum:
Яндекс не просто лжив, он еще и туп.

Ну это уже перебор. Есть такая вещь, как "найден по ссылке". поэтому и может присутствовать в выдаче такая страница, равно как и в гугле. Но если ссылок нет - страница из выдачи все-таки вылетает.

Комплексное продвижение от группы профи. Внимательно, качественно, грамотно. Дизайн, контекст, таргет. (/ru/forum/1024059) hugo.digital (https://hugo.digital)
богоносец
На сайте с 30.01.2007
Offline
765
#7
Владимир-C:
и даже те файлы, которые вызываются через <script src="file.js"></script>

А те, которые вызываются в этом file.js тоже смотрит?

ВC
На сайте с 02.02.2006
Offline
463
#8
богоносец:
А те, которые вызываются в этом file.js тоже смотрит?

Да, вот это самое интересное - file.js Яндексом тоже открывается!

Я в своё время в Яндекс писал с вопросом о том, индексируются ли скрипты. Хотя общеизвестно, что скрипты не индексируются, но всё же решил лично задать вопрос. Ответ был, что не индексируются.

Ну, они и у меня не индексируются, но получается так, что Яндексу их содержимое известно (если только у меня аналитика работает верно).

Вот потому и решил спросить сообщество - как, по вашему мнению, скачивает ли Яндекс файлы, используемые в скриптах ?

[Удален]
#9
Владимир-C:
как, по вашему мнению, скачивает ли Яндекс файлы, используемые в скриптах ?

да,

более того у пс есть роботы которые проходят по ВСЕМ файлам участвующими в формировании страницы :)

богоносец
На сайте с 30.01.2007
Offline
765
#10
burunduk:
есть роботы которые проходят по ВСЕМ файлам участвующими в формировании страницы

А выполняют ли их содержимое?.. как браузеры.

Можно показать в индексе файл.XSL — в котором есть ссылка на скрипт, которую можно записать так, что для прохода по ней придётся выполнить XSLT полноценно.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий