Яндекс.Зеркальщик - беспредельщик!

Kom
На сайте с 20.01.2005
Offline
67
Kom
819

уж и хотел даже смайлик поставить в топике -)

но передумал -)

ситуация такая:

уже более полугода в роботс.тхт на моих сайтах стоит запрет на индексацию определённых страниц (они у всех сайтов одинаковые и их по 3-4 штуки на сайт)

однако вчера зеркальщик яндекса свободно прошёлся по этим файлам на всех моих сайтах, а также по их главным страницам.

а потом спустя час пришёл индексатор и забрал везде главные.

Однако...

п.с. топик получился вызывающий, но просто глаза округлились когда в стате своей увидел такое -) чтож... придётся отдавать 404-ошибку на этих файлах, раз он такой хитрый, наш Яндекс-монополист -)

wolf
На сайте с 13.03.2001
Offline
1183
#1
однако вчера зеркальщик яндекса свободно прошёлся по этим файлам на всех моих сайтах

Зеркальщику robots.txt не указ. Яндексоиды его за робота почему-то не считают. Наезжали уже на них за это дело.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
K
На сайте с 31.01.2001
Offline
737
#2

Если вы сделаете 100 дублей сайта на разных доменах, дадите их проиндексировать, а потом закроете доступ роботу, то как зеркальщик узнает, что вы нагенерили дублей?

Поэтому робот с буквой H не соблюдает запреты robots.txt . Бурную дискуссию по этому поводу вел Wolf с сотрудниками Яндекса (давно было, при желании можно найти эту ветку) .

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
[Удален]
#3

Вот интересно. Я могу ему ошибку выдавать, дык не проще robots соблюдать ?

Kom
На сайте с 20.01.2005
Offline
67
Kom
#4

Miha Kuzmin (KMY), вот и я подумал что это бред...

хотя вроде как и с одной стороны верно сделали они, а с другой фигня вышла.

обозвать это недокументированной возможностью зеркальщика и делать 404 там где не надо ничего смотреть ...

тока бы он не начал 404 ошибки проверять на наличие контента -) вот это точно будет бред -)

S7
На сайте с 13.04.2005
Offline
6
#5

может ссылки на эти страницы явой сделать?..

екатеринбург (http://remont.sky.ru/)
Kom
На сайте с 20.01.2005
Offline
67
Kom
#6

s161077, можно конечно, но когда робот уже знает про страницы - он на них ходит достаточно долго

andrej-ilin
На сайте с 28.03.2005
Offline
42
#7

Стандарт можно, конечно, трактовать по-разному. Типа: "Страницы в индекс то, не попадают. Так в чем, собственно проблема?" Но...

Яндекс сам ссылается на следующий документ:

http://www.citforum.ru/internet/search/rbtspec.shtml

В нем написано:

Назначение

Для того, чтобы исключить посещение сервера или его частей роботом необходимо создать на сервере файл, содержащий информацию для управления поведением поискового робота.

Следовательно зеркальшик - не робот, а сотрудник Яндекса на зарплате. :)

andrej-ilin@yandex.ru

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий