индексируют ли поисковики файлы с нестандартным расширением

E
На сайте с 05.10.2005
Offline
172
803

Случайно по беклинкам обнаружил, что целая сеть каталогов содержит ссылку на мой сайт с ошибкой в УРЛе. Имя файла выглядит как index.php$. И возможности менять данные сайта в этих каталогах не предусмотрено.

То ли я когда-то давно, добавляя сайт в первый каталог сети нажал лишнюю клавишу и не заметил, а они потом тупо копировали линк из базы в базу, то ли скрипт каталога глюканул - только открывается по этой ссылке ошибка 404. Страница ошибок у меня, конечно, своя, но поисковики ее все равно не читают.

Поэтому я сделал файл index.php$ со ссылкой на нормальную морду сайта, и он, как ни странно, открывается в браузере, как обычный HTML. Но вот вопрос - индексируют ли поисковики подобные файлы с нестандартным расширением?

открытая многоязычная словарная база (http://tolmacz.ru)
Skyter
На сайте с 17.02.2005
Offline
175
#1

Поисковики съедают все, что им скармливают!

Юрий Батиевский www.antop.ru (http://www.antop.ru/): тел: +7 903 796 05 86 Ищу SEO-специалиста, специалиста по контекстной рекламе, интернет-маркетолога.
K
На сайте с 18.01.2006
Offline
1
#2

espada, совершенно точно известно, что глобальные поисковики (не те, что сидят на локальной машине провайдера) - индексируют не ФАЙЛЫ, а URL'ы! Т.е. анализируется правильность URL'а согласно RFC и содержимое HTTP-заголовка 'Content-Type'. Если возвращаемый тип документа поддерживается поисковиком - может проиндексироваться.

Но если робот написан так, что отбрасывает URL'ы, ошибочные с точки зрения RFC, может и не проиндексировать. ИМХО, ребята из Я стараются следовать стандартам, значит есть большая вероятность, что именно этот URL - не проиндексирует. На такой случай советую воспользоваться 301 редиректом на правильный URL через mod_rewrite.

СКОРПИОН
На сайте с 05.01.2006
Offline
120
#3
KLArk:
[Т.е. анализируется правильность URL'а согласно RFC и содержимое HTTP-заголовка 'Content-Type'.
...
значит есть большая вероятность, что именно этот URL - не проиндексирует.

Чем же такой URL - неправильный? Это раз.

В вышеописанной ситуации поисковики индексируют не содержимое PHP-файла, а тот текст, который он даёт браузеру. Это два.

В такой ситуации нужно не mod_rewrite настраивать, а добавить к перечню расширений, описывающих файлы в которых может быть исполняемый код PHP, новый тип файла. Это три.

espada:

То ли я когда-то давно, добавляя сайт в первый каталог сети нажал лишнюю клавишу и не заметил

Это как нужно изгальнуться, чтобы ТАКУЮ лишнюю клавишу нажать

(OFF. Как в одной истории из жизни админов:

-У тебя какой пароль?

-Три раза "Shift", потом "natasha")

• Контекстные ссылки с внутренних страниц навсегда (/ru/forum/370882) • Качественные сайты для заработка на контекстной рекламе и ссылках
mediatime
На сайте с 14.12.2004
Offline
39
#4

это делается все втечении 5 минут в настройках сервера в заголовках, ставишь этот файл как html и все,

и роботы получая этот заголовок будут есть все , что угодно начиная от .rar и кончая .gif

Меньше скажешь, раньше выйдешь
Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#5

я бы mod_rewrite использовал бы ... иначе дубляж файлов получится ...

K
На сайте с 18.01.2006
Offline
1
#6
СКОРПИОН:
Чем же такой URL - неправильный?

Согласно RFC 1738 [2.2 и 3.3] (http://www.zvon.org/tmRFC/RFC1738/Output/index.html) Вы правы - символ '$' хоть и специальный, но допустим в части PATH наряду с обычными! Но я бы поостерегся использовать его по двум причинам: во-первых, есть зависимость от того, как соблюдается стандарт, как SE интерпритируют эти специальные символы, а во-вторых, URL содержащий стоку 'index.php$' - не очень информативен и является словесным мусором с точки зрения SE, ведь URL - это самое лучшее место, куда следует пихать ключевики.

СКОРПИОН:
поисковики индексируют не содержимое PHP-файла, а тот текст, который он даёт браузеру

Это понятно, но ведь текст они получают с сервера обратившись по определенному URL. Я же написал о том, попадет этот URL в базу или нет - вопрос спорный.

А вместо mod_rewrite можно использовать и обычный redirect, если первый по каким-то соображениям включать напряг.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий