- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Сегодня обнаружил одну интересную особенность интерпретации Яндексом robots.txt.
Руками удалял раздел из индекса, при этом Яндекс выругался, что раздела нет в robots.txt. Пошел проверять - раздел есть!
Поразбирался. Единственное, что смущало это пустые строки в файле (там запретов много - для удобства разбито по группам). Убрал пустые строчки - Яндекс запрос скушал. Получается, что конец файла он определяет по пустой строке?
http://www.citforum.ru/internet/search/rbtspec.shtml#4
Файл должен содержать одну или несколько записей (records), разделенных одной или несколькими пустыми строками (оканчивающимися CR, CR/NL или NL). Каждая запись должна содержать строки (lines) в форме:
...
Запись должна начинаться с одной или нескольких строк User-Agent, следом должна быть одна или несколько строк Disallow, формат которых приведен ниже. Нераспознанные строки игнорируются.
По пустой строке определяются границы записи, в каждой из которых может быть одна или несколько строк User-agent и одна или несколько строк Disallow.
Таким образом Ваше "удобство" нарушало стандарт, а Яндекс тут был прав, поскольку игнорировал неправильные записи, в Вашем случае все, кроме первой.
Да, хорошие грабли :)