- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здрасьте. А если вы уберете robots.txt, домен больше никогда не попадет в индекс?
А зеркальщик как будет расклеивать зеркала, если вы уберете редирект?
Почему никогда? Если он периодически обращается к этому файлу - пусть хоть заддосит, но должен следовать указаниям.
Тогда отключите запись логов, отключите сервер от интернета в конце концов.
Не надо хамить 🙅
У создатей ботов несколько другая логика...
... с yandex.ru стоит 301 на www.yandex.ru но роботс по первому хосту доступен. Думаете это случайно так?
А по-серьёзному - серверу незачем обрабатывать лишние запросы.
Это вы считаете "по-серьёзному" ? У вас обработка одного запроса сервером сколько денег стоит?
А может быть вы последний раз читали help.yandex.ru в 2004 году и не знаете про про директиву CrawlDelay ? Поставьте хоть 3600 секунд.
Вы путаетесь в показаниях:
Там запрет, значит всё - стоп! Больше не запрашивает адреса ни со старого, ни с нового доменов.
Если он периодически обращается к этому файлу
Так "стоп" или "периодически обращается"?
Вы же хотите чтобы "стоп". Я вам возражаю: тогда робот никогда больше не узнает, что robots.txt изменен.
Я пытаюсь понять, почему у вас возникают сложности на пустом месте, или это от недостаточной информированности, или тут что-то другое.
Это вы считаете "по-серьёзному" ? У вас обработка одного запроса сервером сколько денег стоит?
А может быть вы последний раз читали help.yandex.ru в 2004 году и не знаете про про директиву CrawlDelay ? Поставьте хоть 3600 секунд.
Робот не следует никаким директивам, в том числе CrawlDelay, т. к. получает 301 ответ. По которому переходит и получает 200 OK уже на новом домене, где ему всё запрещено. И начинает обращаться к файлам на старом домене.
Так "стоп" или "периодически обращается"?
Вы же хотите чтобы "стоп". Я вам возражаю: тогда робот никогда больше не узнает, что robots.txt изменен.
"Периодически обращается" относится к файлу /robots.txt, в котором "стоп". Значит никакие файлы с сайта больше не запрашивать.
motorhead добавил 16.09.2011 в 18:38
Нашёл огорчительный ответ:
http://help.yandex.ru/webmaster/?id=996567
По-моему, это неправильно :(
И там же для вас, оптимизаторы, разница между YandexBot и Yandex:
User-agent: Yandex - будет использована всеми роботами Яндекса, кроме основного индексирующего.
motorhead добавил 16.09.2011 в 20:07
И ответ службы поддержки Яндекса:
Если робот получает http-код отличный от 200, считается, что доступ роботу не ограничен. Переход по редиректу робот не производит, а запретить индексирование страниц другого домена невозможно.
--
С уважением, Платон Щукин
Служба поддержки Яндекса
http://help.yandex.ru/