Яндекс накосячил с соблюдением стандарта файла robots.txt

Каширин
На сайте с 03.01.2004
Offline
1018
#51
k-os:
Недавно столкнулся с этой проблемой, нашёл решение с использованием mod_rewrite:
1. Сделал файл robots.php c таким содержанием:

<?
if (stristr($_SERVER['HTTP_HOST'],'www.имя_сайта.ru'))
{
print "User-agent: *\r\nDisallow: /";
}
else
{
print "User-agent: *\r\nDisallow: /admin/";
}
?>

Здесь главным выбрано зеркало без префикса www.

2. Прописал в htaccess такую дерективу:

RewriteRule ^robots.txt robots.php [L]

Теперь сайт с www запрещается для индексации, а без www нет..

Я также использовал динамический robots.txt с мод рерайтом. Но я пошел немного дальше - перепер тип контента на текст, и выдавал 404 ошибку по адресу robots.php.

И все прекрасно работало :)

Lupus
На сайте с 02.11.2002
Offline
241
#52
Каширин:
Я также использовал динамический robots.txt с мод рерайтом. Но я пошел немного дальше - перепер тип контента на текст, и выдавал 404 ошибку по адресу robots.php.

Сегодня столкнулся с похожей проблемой. Правда не стал химичить с php, а сделал проще:

RewriteEngine on

RewriteBase /

RewriteCond %{HTTP_HOST} ^www\..*$

RewriteRule ^robots\.txt robots1.txt [L]

There are two types of people in this world: 1. Those who can extrapolate from incomplete data.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий