- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Специально для тупых ботов сделал ловушку: невидимая ссылка на директорию, запрещенную в robots.txt. И как вы думаете, кто стал первым посетителем ловушки? :laugh:
66.249.66.15 - - [] "GET /forum/catch_bots/index.php HTTP/1.0" Mozilla/5.0 (compatible; Googlebot/2.1; +httр://www.google.com/bot.html)
Стал разбираться, оказалось, что последний раз гугл загружал файл robots 13 часов назад (по его же информации) и наивно считает, что файл за это время не мог измениться, хотя активно пасется на форуме весь день.
Стал разбираться, оказалось, что последний раз гугл загружал файл robots 13 часов назад (по его же информации) и наивно считает, что файл за это время не мог измениться, хотя активно пасется на форуме весь день.
А в таком случае налицо неверная интерпретация имеющихся фактов в заголовке темы. ;)
А в таком случае налицо неверная интерпретация имеющихся фактов в заголовке темы. ;)
Заголовок исправил.
Упс.. а этот форум не умеет править основной заголовок??
Хм. Он просто обратился к директории или в индекс загнал?
Хм. Он просто обратился к директории или в индекс загнал?
Робот запросил файл index.php и, как я полагаю, прочитал ответ скрипта. Что он сделал с этой инфой потом - мне неизвестно.
Я о другом, робот не считывает содержимое robots.txt перед каждым переходом по ссылке, а считает, что загрузки содержимого этого файла раз в сутки (?) достаточно.
Никого не обвиняю, ничего не хочу, просто информация! Видимо, решение проблемы простое, дождаться, когда гугл обновит инфу о файле robots и только тогда загружать неиндексируемый контент.
гугля редко смотрит в роботс.тхт, о чем недавно было написано на каком-то из официальных блогов. к тому же робот имеет свое мнение по поводу того загонять в индекс страницу или нет - например, если на закрытую роботсом страницу стоит ссылка, гугля запросто проигнорирует ваши инструкции...
Понятно, вопросов больше нет.