Запрет разделов к индексации и mod_rewrite

12 3
LD
На сайте с 12.06.2002
Offline
71
3609

Просветите, пожалуйста, какой конкретно раздел надо запрещать к индексации, когда используется mod_rewrite? Тот, который указан в "видимом" URL или же тот, в который URL переписывается сервером. Флага R в правиле нет. Но, возможно, будет.

[Удален]
#1
Тот, который указан в "видимом" URL или же тот, в который URL переписывается сервером.

Запрещать второй, разумеется. Или вообще не запрещать - видимые дубликаты должны распознаться как основные версии, поскольку именно на них, насколько я понимаю, указывает вся внутренняя навигация.

Флага R в правиле нет. Но, возможно, будет.

Извиняюсь, этого я совсем не понял. Зачем тогда вообще mod_rewrite используется? Причем тут флаг R?

LD
На сайте с 12.06.2002
Offline
71
#2
Запрещать второй, разумеется

Интересный получается тогда результат:

На запрос по первому URL, то есть явно прописанному:

GET /folder1/folder2/folder3/file.html

приходит код 200

То есть второго, в который это всё переписывается -- не видно вообще и никому, кроме задерганного жизнью и мной апача :)

Никаких видимых в данном случае дубликатов нет, не было -- и не будет.

А редирект иногда нужен, правда, в других случаях :) Проще сделать одно правило на regexp'ах, чем прописать 50 RedirectPermanent. Кроме того, если сервер некорректно настроен (я с этим поэкспериментировал на своей уже машине) -- без флага [R] в явном виде -- ничего не будет работать.

[Удален]
#3
То есть второго, в который это всё переписывается -- не видно вообще и никому, кроме задерганного жизнью и мной апача.

Ну да, а что собственно интересного? :)

Никаких видимых в данном случае дубликатов нет, не было -- и не будет.

Ты анамнез не полный рассказал :) Я думал, что сайт, который ранее был известен и проиндексирован как динамический, теперь переделывается под статику. Если сразу делать как надо, то вообще ничего можно не запрещать.

Кстати, под видимыми дубликатами я подразумевал именно те URL, которые запрашиваются юзер-агентом. Соответственно - реальная динамика - это невидимые дубликаты, которые тоже могут по недосмотру стать известными роботу. Но страшного в этом ничего не будет.

А редирект иногда нужен, правда, в других случаях.

Да даже и не иногда, штука удобная и полезная. Только с запретом индексации связи я так и не вижу.

Кроме того, если сервер некорректно настроен (я с этим поэкспериментировал на своей уже машине) -- без флага [R] в явном виде -- ничего не будет работать.

То есть что значит ничего не будет работать? что - совсем ничего? :)

LD
На сайте с 12.06.2002
Offline
71
#4
Ты анамнез не полный рассказал Я думал, что сайт, который ранее был известен и проиндексирован как динамический, теперь переделывается под статику. Если сразу делать как надо, то вообще ничего можно не запрещать.

Наоборот совсем: делается нечто динамическое, на которое внутри будет масса ссылок, которые для моего же личного удобства (ну и не только моего, правда) будет выглядеть статическими урлами и ничего из этого индексировать не надо, потому что не надо :) То есть нужно запретить :) И, насколько я понял, запретить в данном случае надо видимый URL

Только с запретом индексации связи я так и не вижу.

Если выставляется флаг [R] -- ну да Вы это и без меня знаете -- виден и второй URL. И что тогда запрещать -- вопрос остается открытым. И нужно ли запрещать? Что-то торможу я, видать...

что значит ничего не будет работать? что - совсем ничего?.

URL перепишется, конечно, а вот 403 в ответ получить на попытку исполнения скрипта -- без вопросов :) А всего-то -- бардак с Options в Directory и ScriptAlias. Но это тоже уже лирика, то есть злостный оффтоп.

[Удален]
#5

Давайте медленно и два раза проговорим :)

Действует так (отвлечемся на минутку от того, динамические URL или статические).

Пусть есть RewriteRule re1 re2[L]

При запросе GET re1 юзер-агенту будет просто выдано содержимое файла re2.

Далее, пусть есть RewriteRule re1 re2[L,R]

При том же запросе юзер-агенту будет выдан стандартный 302 редирект на файл http://hostname/re2

В данном случае под содержимым файла также подразумевается результат работы скрипта.

Наоборот совсем: делается нечто динамическое, на которое внутри будет масса ссылок, которые для моего же личного удобства (ну и не только моего, правда) будет выглядеть статическими урлами и ничего из этого индексировать не надо, потому что не надо То есть нужно запретить И, насколько я понял, запретить в данном случае надо видимый URL

Не понял, но попробую ответить ;)

Если надо, чтобы в базе поисковиков оказались страницы с именами как в 1-х аргументах RewriteRule - то запрещаем вторые, и vice versa.

Если выставляется флаг [R] -- ну да Вы это и без меня знаете -- виден и второй URL. И что тогда запрещать -- вопрос остается открытым. И нужно ли запрещать? Что-то торможу я, видать...

Запрещать ничего не надо, см. выше.

LD
На сайте с 12.06.2002
Offline
71
#6
Давайте медленно и два раза проговорим

Судя по всему, я действительно чего-то глобально не понимаю :(, извините, так что давайте.

Когда без редиректа -- мне вообще ничего не надо поисковикам показывать. То есть запретить re1, насколько я понял.

А когда с редиректом -- как я понял -- всё-таки ничего запрещать не надо, в том числе и re1, если нужно, чтобы видно было re2 -- или нет? Ведь, если запретить re1, то они просто по ссылке не пойдут?

[Удален]
#7

То есть задача - с помощью mod_rewrite сделать для служебного пользования, так сказать, менее мерзко выглядящие URL (re1). Соответственно - раз они для служебного пользования, то и надо их запретить.

А когда с редиректом -- как я понял -- всё-таки ничего запрещать не надо, в том числе и re1, если нужно, чтобы видно было re2 -- или нет? Ведь, если запретить re1, то они просто по ссылке не пойдут?

Если ссылки указывают на re1, то запрещать не надо. Но это нехорошо все равно, т. к. через редиректы роботы ходят, но не все. А вот если ссылки указывают на re2, то можно запретить re1, можно не запрещать, разницы никакой, как и никакого смысла вообще подобную конструкцию делать.

Вообще - крайне странная постановка задачи...

LD
На сайте с 12.06.2002
Offline
71
#8

Вот! Спасибо большое, теперь я, наконец, понял по поводу редиректов и всего остального.

Вообще - крайне странная постановка задачи...

Да и сайт у нас про странное, и делался странно, и сам я очень странный человек, занимающийся странными вещами :) Так что всё как раз нормально :)

Д
На сайте с 27.11.2002
Offline
23
#9

Хотел было вопрос задать, но после прочтения темы возник еще один :) ... Имеется сайт с динамическими ссылками и я хочу посредством mod_rewrite все представить в статическом виде... Вопрос в том, следует ли запрещать к индексированию динамические страницы? То есть получается, что есть две одинаковые страницы(например site.com/file.php?=page1 и site.com/file/page1) и как на это посмотрит поисковик... Может, в самом деле стоит запретить?

Ну и главный вопрос по статье на сайте по mod_rewrite... Там есть такие строчки

---------------------

RewriteEngine On

Options +FollowSymlinks

RewriteBase /

RewriteRule ^index/(.*)$ /index.php/$1

----------------------

Все хорошо, но возникает куча проблем с includ'ами и относительными ссылками... А делать абсолютные неудобно... Поэтому я хотел поставить все это дело в верхнюю директорию сайта, от которой все относительные ссылки и работает... Но проблема в том, что не разобрался в синтаксисе строчек, указанных выше... То есть, как их изменить, если мне надо, чтобы при запросе site.com/index<что_угодно>(например, site.com/index15)обрабатывался файл site.com/index.php...

[Удален]
#10
Может, в самом деле стоит запретить?

Как угодно. Можно и не запрещать.

То есть, как их изменить, если мне надо, чтобы при запросе site.com/index<что_угодно>(например, site.com/index15)обрабатывался файл site.com/index.php...

Чтобы всегда выдавалось содержимое одного и того же файла /index.php

RewriteEngine On

RewriteBase /
RewriteRule ^index.* index.php[L]

Если это не то, что надо, постарайся яснее выразить свою проблему.

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий