Такое уже было - всё закрыл от индексирования - сработало. Но хочется всё настроить как следует
Спасибо, знал бы как - не создавал бы топик. Прошу прощения за нубовский вопрос, но будет ли работать такая директива в .htaccess, если фронтендом установлен nginx?
Кстати, нашёл похожий топик /ru/forum/817060,
где для запрета доступа к странице /index.pl?get_id=5 предлагается следующая конструкция:
if ($request_uri = "/index.pl?get_id=5") { return 404; }
Можно ли задать подобное условие по маскам
page.html*
page.pdf*
?
Большое спасибо! - не ожидал такой развёрнутой дискуссии
Но разве это не улучшит поведенческие факторы и не подтянет другие страницы в поиске? (даже без ссылок в документе на ресурс-источник)
Безусловно, хотелось бы, но тут кроме технических есть и другие сложности- ведь помимо pdf существуют и другие форматы
Впрочем, как вариант, для маркировки документов можно нанять школьника :) Но опять же - есть ли в средне- и долгосрочной перспективе в этом экономический смысл? Склоняюсь к той мысли, что всё же есть
Что делать, это Россия..., закон могут вывернуть так, как нужно...
но почему-то всевозможные googli.ru скуплены пачками. Хотя возможно, здесь расчёт на перепродажу... например, под фанпроект ☝ К слову, нашёл вот нечто похожее: http://owebmoney.ru - и посещаемость ведь неплохая! И тогда возникает ещё один вопрос: возникнут ли претензии у Яндекса к ресурсу oyandexe.ru? :)
Спасибо за ответ, а уж думал - форум на летнем отдыхе :) Тоже склоняюсь к тому, что дополнительные файлы с уникальным контентом улучшат ранжирование сайта по различным запросам.
Только директива AddType application/x-httpd-php5 .htm .html .php
CMS как таковая отсутствует, сайт самописный: html + php инклуды + js/php скрипты
Редирект - это, конечно, неплохо, но странно - почему сервер не отдаёт 404 ошибку - ведь этих страниц фактически не существует в директории сайта
А разве auto -не общеупотребительное слово? И в чём логика? ...хотя, например, igoogle.ru, гораздо круче, чем googli.ru:)
Кстати, возвращаясь к googl - я обнаружил очень много занятых доменов с вхождением этого буквосочетания. Уважаемые домейнеры, если не секрет - тайп-ин трафик? ...или какая-то тёмная сторона домейнинга? 🍿
А, кстати, если что-то удаётся придумать с высоким количеством тайп-ин заходов?---------- Добавлено 07.07.2015 в 06:17 ----------Doma-in, спасибо, думаю даже не ответят. Учитывая их общительность в других сервисах :)
Однако ж, да, вот ещё сабж: http://googloid.org - с дикой посещаемостью
А по прямому брендовому запросу защитились они отлично:
https://yandex.ru/search/?lr=21&text=google - налепили больше десятка зеркал:)
Страницы у ТС-а уже в индексе и, прежде всего, нужно закрыть мусор
Если сайт самописный (html + инклюды + скрипты), то виноват почти 100% не какой-то определённый php-скрипт, а внутренние относительные ссылки вида <a href="razdel/page.php">, которые и "плодят" именно такие многоэтажные урлы.
И тогда с практической точки зрения Disallow достаточно - по крайне мере, у меня вот уже несколько лет Яша может и видит, но НЕ ВЫКАЧИВАЕТ "всё это добро" (что самое главное), а юзеры подобные адреса набирают довольно редко :) Впрочем, сейчас как раз и будет такой редкий случай - здесь, безусловно, качественное решение - редирект или 404:
/ru/forum/901874
Давайте спросим у админов Сёрча ,как?☝
Если функциональности хватает, то движок совершенно ни к чему. Самый простой вариант Disallow: /razdel/*.php/* (лично мне помогло).