robots.txt нет выхода?

Independence
На сайте с 29.10.2005
Offline
428
451

Пусть есть /cgi-bin/ директория, которая в robots.txt закрыта для индексации поисковиками полностью.. Файлы форума лежат в поддиректории cgi-bin/forum ..

Вопрос, можно ли как-то сделать, чтобы поисковики индексировали содержание подпапки с форумом, но не индексировали базовую /cgi-bin/ директорию (файлы и результаты их работы тоже)?

Я знаю, что можно через .htaccess все перерулить.., но в силу специфики форума, его структуры этот способ не нравится + возможно, что из-за кода некоторых скриптов будут глюки с переадресацией, то есть придется корректировать код скриптов форума, контент по одному и тому же адресу может поменятьсяс одного адреса на другой..

Понимаю, что в robots.txt можно тупо перечислить все файлы из базовой /cgi-bin/ директории, но это нравится еще меньше по очевидным причинам..

Правильно я понимаю, что через robots.txt эту задачу (закрыть /cgi-bin/, открыть /cgi-bin/forum/) решить нельзя, если не говорить о некоторых поисковых системах с дополнительными фичами..?

У форума есть .html-страницы, часть из которых имеет удобную адресацию, некоторые выводятся в .html через include, они отлично индексируются. Но вот часть страниц находятся в архиве, которые выводятся через обращения вида /cgi-bin/forum/board.cgi?topic=1 и т.п. До этого момента закрывал скриптовые адреса страниц форума от индексирования, что называется "от хакеров и греха подальше"..

AN
На сайте с 05.06.2004
Offline
243
#1
Independence:
Правильно я понимаю, что через robots.txt эту задачу (закрыть /cgi-bin/, открыть /cgi-bin/forum/) решить нельзя, если не говорить о некоторых поисковых системах с дополнительными фичами..?

Правильно...

Размещу ваши баннеры на посещаемых сайтах. Места еще есть! Возможен безнал. (/ru/forum/324945) Нужны копирайтеры/рерайтеры - медики. Пишите в личку. (/ru/forum/676932)
Лёлик
На сайте с 28.04.2006
Offline
54
#2

С помощью .htaccess отдавайте роботу 403 при запросе любого файла или директории в /cgi-bin/ , кроме /cgi-bin/forum/

FlyAway
На сайте с 01.06.2005
Offline
439
#3

Independence, да правильно, с помощью robots.txt вы эту проблему не решите.

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий