Опять robots.txt или снова ходим по граблям...

T.R.O.N
На сайте с 18.05.2004
Offline
314
654

Когда-то такой вопрос всплывал, но сейчас найти не смог. Решил все описать в одном месте.

И так:

имеем URL _http://******.ru/shop/

имеем файл robots.txt с указанием Disallow: /shop/

теперь вносим в адурилку яши страницу _http://******.ru/shop/ - все ок. Яша говрит - url запрещен в robots.txt.

пробуем еще раз, но чуть меняем url _http://******.ru/SHOP/ - форма добавляет и говорит все будет проиндексировано. Ведь url, по своей сути, не чуствителен к регистру (если тольок что-то специально не настроено на серваке)

Безусловно - если сайт делают ровными руками, такой путаницы бфть не может, но вот внешние входящие ссылки могут быть поставлены любые. Возникают некоторые подозрения, ведь яша в некоторых случаях держит в базе имя домена большими буквами.

По идее, если все так, то есть возможность заставить яшу проиндексировать страницы запрещенные в роботсе.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
tommy-gung
На сайте с 22.11.2006
Offline
287
#1

T.R.O.N, .nix сис-темы чувствительны же к регистру, у меня 404 возвращает. Или у Вас windows-сервер?

Здесь не могла быть ваша реклама
K
На сайте с 31.01.2001
Offline
737
#2
T.R.O.N:
Ведь url, по своей сути, не чуствителен к регистру

Только часть, отвечающая за Hostname, может быть любыми буквами.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
T.R.O.N
На сайте с 18.05.2004
Offline
314
#3
tommy-gung:
.nix сис-темы чувствительны же к регистру

с каких пор?

tommy-gung:
у меня 404 возвращает.

Значит просто у Вас сделаны настройки так. При этом апач так и поступает.

tommy-gung
На сайте с 22.11.2006
Offline
287
#4
T.R.O.N:
с каких пор?

думалось, что всегда :)

но утверждать не буду, я не специалист по .nix

Walik
На сайте с 08.01.2008
Offline
75
#5

Ну вобще-то файлы с большой и с маленькой буквы на линуксе и тд это разные файлы...

T.R.O.N
На сайте с 18.05.2004
Offline
314
#6
Kost:
Только часть, отвечающая за Hostname, может быть любыми буквами.

нашел подтверждение этому только для сайтов, которые висят на виртуальных хостах

Walik:
Ну вобще-то файлы с большой и с маленькой буквы на линуксе и тд это разные файлы..

это да, а вот с каталогами/папками все не так просто...

хотя может это еденичные проявления

A1
На сайте с 01.06.2007
Offline
14
#7
T.R.O.N:
нашел подтверждение этому только для сайтов, которые висят на виртуальных хостах
это да, а вот с каталогами/папками все не так просто...

хотя может это еденичные проявления

Вообще shop, Shop, SHOP и ShOp для *nix всегда были разными как файлами так и папками, хотя возможно современные полукоммерческие линухи и запрещают при определенных настройках создавать папки (файлы) где различается в имени только регистр, для обеспечения совместивости с Win например.

А еще возможно что у вас сайт настроен через mod_rewrite. Тогда вполне может быть что конкретно для вашего сайта http://***.ru/shop/ и http://***.ru/SHOP/ - это одно и то же. Но это не значит что яша будет под вас подстраиваться, т.к. в нормальных условиях это не одно и то же.

Поэтому кстати во избежание путаницы рекомендую использовать в урлах и именах файлов/папок всегда только нижний регистр.

T.R.O.N
На сайте с 18.05.2004
Offline
314
#8
antonr1982:
Но это не значит что яша будет под вас подстраиваться, т.к. в нормальных условиях это не одно и то же.

Поэтому кстати во избежание путаницы рекомендую использовать в урлах и именах файлов/папок всегда только нижний регистр.

так это не оспоримо. И вопрос не в подстройке яши. Вопрос только в том, что иногда слышаться(имеено это и проверял), мол боты не слушаются роботса и что в индекс попадают запрещенные файлы. Вот об этом и сказал

SEO_87
На сайте с 05.08.2008
Offline
104
#9

Думаю это единичный случай или глюк - сверил имя ссылки и то что в роботс прописано, пообещал проиндексировать, а при индексации снова роботс от ворот поворот дает)) Если бы это действовало этим уже пользовались вовсю.Имхо

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий