- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Что касается Вашего случая, здесь другая ошибка, возникшая, очевидно, после прочтения другой вредительской статьи про robots.txt. Почитайте стандарт.
http://www.robotstxt.org/wc/norobots.html
Спасибо, прочел, составил следующее:
Хотя никаких нарушений стандарта в предыдущей версии я не вижу.
Теперь правильно :)
> Хотя никаких нарушений стандарта в предыдущей версии я не вижу.
Нет, конечно, нарушений стандарта, конечно, нет. Однако данный обзац:
The record starts with one or more User-agent lines, followed by one or more Disallow lines, as detailed below. Unrecognised headers are ignored.
- означает то, что в предыдущей версии Вашего robots.txt была только одна запись (record), причем все user-agent'ы, кроме первого, игнорируются.
Другое дело, что в стандарте не написано явно, что делать, когда в записи есть строчка с "пустым" "Disallow:" и с не пустыми:).
> Недавно меня проиндексил Рамблер.
В выдаче Рамблера про Вас написано 16.04.2003 - это было до того, как Вы выложили неправильный robots.txt.
Это камень в мой огород, в статье действительно ошибка.
Gray, можно каким-нибудь образом подправить текст статьи?
melkov,
Сегодня ночью приходил Yandex/1.01.001 (compatible; Win16; I) и дергал все подряд с доменов отличных от www.lomalka.ru.
Т.е. значит не совсем Вы вручную забанили мои домены. 114 запросов было.
Но вчера вечером я сделал:
И еще обнаружил очень странную вещь, в логе Апач у меня пишет содержание Location:, так вот _иногда_ в логе видно что редирект прошел на http://www.lomalka.ruhttp://www.lomalka.ru
Хотя первая строка запроса в логе видна как "GET / HTTP/1.1"
Как такое может быть не знаю, mod_rewrite использую давно, никогда ранее такого не видел. На всякий случай сменил (.+) на ^/(.*?)
Еще поставлю tcpdump с фильтром на вашу сетку.