Зеркалирование и слэши (.htaccess и роботс.тхт)

M
На сайте с 08.08.2012
Offline
48
360

По-моему, здесь самая подходящая тема, если промахнулся - прошу переместить.

Разъясняю проблему. Поисковики несколько лихорадило достаточно длительное время из-за того, что сайт жил как на www. так и вне него. Научился исправлять эту ошибку в .htaccess, а вот что нужно добавлять в роботс.тхт - я не нашёл в Яндэхе.

Вторая проблема заключается в ужасных слешах "///". Пускай у нас есть сайт мой_сайт.ком . И файл на нём с названием "файл.хтмл", проблема в том, что он спокойно открывает "мой_сайт.ком//////файл.хтмл", а лучше показывать ошибку (так меня научили). Я научился исправлять с помощью .htaccess более частную проблему, а именно бороться со слэшами вида "мой_сайт.ком/папка/////файл.хтмл". Если кто-то хочет, чтобы я рассказал как я частично решил обе проблемы, с радостью поделюсь.

Всем заранее спасибо.

Размещение, аренда сервера (http://datacenter.mcn.ru/) в московском дата-центре МСН Телеком от 1100 руб./мес.
siv1987
На сайте с 02.04.2009
Offline
427
#1
m1kle:
Я научился исправлять с помощью .htaccess более частную проблему, а именно бороться со слэшами вида "мой_сайт.ком/папка/////файл.хтмл".

Если htaccess может обрабатывать многочисленные слеши то

RewriteEngine On

RewriteCond %{REQUEST_URI} /{2,}

RewriteRule .? 404.html [F]

m1kle:
а вот что нужно добавлять в роботс.тхт - я не нашёл в Яндэхе.

Host нужно добавлять. Только добавлять его после редиректа смысла особого нету.

M
На сайте с 08.08.2012
Offline
48
#2
siv1987:
Если htaccess может обрабатывать многочисленные слеши то

RewriteEngine On
RewriteCond %{REQUEST_URI} /{2,}
RewriteRule .? 404.html [F]


Host нужно добавлять. Только добавлять его после редиректа смысла особого нету.

Спасибо Вам огромное, но добавление в htaccess указанных Вами строк не помогло. Если что, у меня Apache.

По поводу роботс.тхт, Вы имете в виду строку "Host: http://m1kle.ru/"? На всякий случай добавлю, но как понимаю, поисковики и прочие сами перестроятся и без неё.

siv1987
На сайте с 02.04.2009
Offline
427
#3
m1kle:
Спасибо Вам огромное, но добавление в htaccess указанных Вами строк не помогло.

Смотря какой апач/сервер. У меня на локалке оно тоже не работает, а на сервере - да. Ну если апач не в силах, можно решить через robots

Disallow: //

Disallow: /*//

По поводу роботс.тхт, Вы имете в виду строку "Host: http://m1kle.ru/"?

http://help.yandex.ru/webmaster/?id=996567#996574

На всякий случай добавлю, но как понимаю, поисковики и прочие сами перестроятся и без неё.
siv1987:
Только добавлять его после редиректа смысла особого нету.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий