Яндекс игнорирует роботс!!! Проверено!!!

12
Александр Тер-Арутюнов
На сайте с 12.04.2004
Offline
72

<<off>> обмен больше похожий на воровство ...

"Победы - не окончательны, поражения - не смертельны, вопрос в том - достанет ли воли продолжать" - Уинстон Черчиль
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#12

Устное предупреждение всем, кто вместо ответа на вопрос предпочел упрекать автора темы в некрасивых вешах. Вас об этом не спрашивали и всяких демонстраций ненависти здесь устраивать не надо.

По теме - yas, вот это сейчас, к сожалению, нам не проверить

Robots был добавлен еще до того как было подана заявка на регистрацию!
, но, скорее всего, страница действительно проиндексировалась раньше, чем там появился robots.txt. Можно попробовать посмотреть по логам.

Добавление вручную при наличии запрета в robots.txt ничего не даст. А вот удалить можно.

C
На сайте с 19.09.2001
Offline
120
#13
Добавление вручную при наличии запрета в robots.txt ничего не даст.

Даст на некоторое время:

1. http://www.google.ru/robots.txt - Вторая строка

Disallow: /search

2. http://www.yandex.ru/yandsearch?text=%23url%3D%22www.google.ru*%22&surl=google.ru&pag=u

результаты 6,7,9,10.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
Y
На сайте с 20.05.2004
Offline
103
yas
#14

Gray, такого просто быть не может! Страница была добавлена после того как все было закачено на сервер, и эту страницу я никуда не добавлял в ручную!

C
На сайте с 19.09.2001
Offline
120
#15

yas, никому не запрещено добавлять страницы чужого сайта с помощью формы Яндекса. ;)

W
На сайте с 26.03.2004
Offline
20
#16

так что наверно я добавлю в скрипт обмена и автоматический сабмит страницы с моим кодом через форму яндекса ;)

wolf
На сайте с 13.03.2001
Offline
1183
#17

Чего вы всполошились? Это же давно известный факт. Роботы "D", "Н" и "М" Яндекса игнорируют robots.txt. Его соблюдает только робот "I". Ну, и "P", наверное (специально не проверял)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
M
На сайте с 25.01.2001
Offline
57
#18

возможно страница была проиндексирована раньше добавления файла Robots.txt... И еще вопрос, если страница запрещена к индексации файлом Robots.txt, но ее вносят вручную в Яндекс через yandex.ru/addurl.html, будет ли такая страница проиндексирована? Может тут именно такой случай?

В Addurl вроде бы есть ошибка, из-за которой выдается сообщение об успешном добавлении.

На самом деле такая страница проиндексирована не будет.

Если страница была проиндексирована раньше, чем была запрещена в robots.txt, то ее удаление из базы произойдет, строго говоря, через неопределенное время.

K
На сайте с 31.01.2001
Offline
737
#19
На самом деле такая страница проиндексирована не будет.

Я тоже так думал.

http://www.yandex.ru/yandsearch?serverurl=top100.rambler.ru/cgi

одну из страниц туда добавил я через addurl неделю назад, и видимо был не одинок. Уже два апдейта она там висит, допускаю, что робот I еще не успел зайти за robots.txt. Тем не менее, в http://top100.rambler.ru/robots.txt - эти адреса запрещены.

Что я не так делал? Хотелось бы разобраться. А если робот D не считается с robots.txt, то на это наверное есть причина? Ведь есть опасность, что все желающие в погоне за увеличением ссылок на свои сайты начнут раз в неделю совать их в addurl в надежде на эти ссылки. Если это не работает, то не нужно будет и лишний раз дергать addurl.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
C
На сайте с 19.09.2001
Offline
120
#20

По моим наблюдениям робот D берет страницу только тогда, когда ее нет в базе Яндекса, если же она есть, то просто выдается сообщение, что страница уже известна и т.д.

Робот D, вернее сказать сервис Яндекса по добавлению страниц, который идентифицируется как Yandex/1.01.001 (compatible; Win16; D), по мнению разработчиков не является роботом, которому нужно следовать правилам в robots.txt, поскольку сервис запускается по требованию пользователя, а не автоматически.

Kost, опять же по наблюдениям, страница, которая есть в базе, но запрещена в robots.txt удажяется из базы не тогда, когда робот I читает robots.txt, а когда доходит очередь этой страницы на переиндексацию, что бывает иногда довольно долго, если сайт большой или переиндексируется редко.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий