- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вам бы только на академика наехать :)
В любом случае не указывать завершающий /, желая закрыть только директорию опасно - есть хорошая вероятность запретить лишнее.
Я бы ещё на досуге подумал, как программист пишущий робот интерпретирует фразу
This can be a full path, or a partial path
Я по крайней мере сказал бы, что /dir1/dir2/ - это полный путь, /dir1/ это частичный путь, а /dir1 это вовсе и не путь, а файл без расширения. Просто потому, что для меня файл и путь до него - разные понятия.
AiK, Вы, на мой взгляд, все несколько усложняете.
Программисту, пишушему парсер robots.txt, как раз проще всего.
Он берет две строки:
1) Строку URI или URL или как там правильно называется то, что запрашивается GET'ом;
2) Строку Disallow из robots.txt соответствующего домена
и делает регистрозависимый поиск 2-й строки в начале 1-й. Если найдена, ссылка закрыта, если нет -- добро пожаловать робот!
Именно поэтому где-то рядом я писал Nicon'у, что при закрытии динамических страниц важен порядок параметров скрипта в ссылке.
NULL,
:) обшибся я когда писал 2-ой свой пост.
Суть следующая: Disallow: /sitemap - запрещает sitemap.html, а Disallow: /sitemap/Default.asp - именно www.site.ru/sitemap/Default.asp - такой URL роботы почему-то забирают.
Касаемо того, запретит ли Disallow: /sitemap дирректорию /sitemap/ - этого не знаю... Пока оставлю оба варианта.
И тогда для большей надежности в /sitemap/Default.asp залепить еще
<META NAME="ROBOTS" CONTENT="NOINDEX">
:D
Господа!
Давайте проясним два вопроса.
1. Собственно правильный синтаксис.
Так, если вы пишете Disallow: /sitemap, то запрещаете и sitemap.html и /sitemap/Default.asp, если написать точно Disallow: /sitemap/Default.asp, то это не означает запрета /sitemap/default.asp, так как для робота это два разных документа, хотя сервер выдает один и тот же.
2. Некая иннерционность поведения роботов и обновления баз поисковиков. Если эта ссылка была известна роботам раньше и вы ее решили закрыть, то не все вот так сразу и получится :(
Inktomi, например, еще полгода будет исправно запрашивать запрещенный к индексированию документ.
Inktomi, например, еще полгода будет исправно запрашивать запрещенный к индексированию документ.
Про обновление базы поисковика я не говорил. 🙅 Хочу просто запретить роботам запрашивать определенные URL - все. Разве не для этого предназначен robots.txt?! 😕
Да, для этого. Но если робот раньше знал эту страницу, то он может еще некоторое время запрашивать запрещенный к индексированию документ.