Все верно, только пунк 3 не опционально, а обязательно...
Ведь если робот найдет сслыку вида http://www.mysite.ru/word/n1/n2/n3/, но будет запрещен доступ в папку /word/ со всеми ее подпапками, тогда робот и не пойдет дальше главной.
А вообще лучше не мудрить с Allow, а просто ручками прописать Disallow для всех файлов и папок кроме index.php, /word/ и /, т.е. не напишите чего доброго что то вроде:
Disallow: /*
или
Disallow: *
С любой страницы. Притом если у страницы донора PR (в ссылках, а не в условных еденицах) допустим 1000, то каждой странице, на которую она ссылается она передаст часть веса от 870 ссылок. т.е. если на странице 10 ссылок, каждая из них должна получить примерно по 87...
Вот статья про PR, может заинтересует http://www.digits.ru/articles/promotion/pagerank.html
Понятное дело, что не существуют... Это просто в файлике .htaccess прописанны павила, по которым урлы вида, с которыми реально работает CMS:
подменяются урлами вида:
но все это происходит прозрачно для пользователей и поисковиков. Поисковики, как и пользователи не лазят по папкам на вашем сервере, а просто дают запрос серверу, мол дай мне документ с таким урлом, сервер решает в зависимости от урла, что ответить и отдыет резальтат клиенту (человеку или ПС). Только ПС, когда находят какой-либо урл на ваш сайт, сначала по маске сравнивают его с правилами в robots.txt и если правилами индексация его не запрецена, то посылают запрос серверу, дай мол мне этот документ.
Какой маркетинговый ход... Все проблемы решит новый домен от PWX.ru :)
Aveter, если бы линки были динамические, т.е. вида site.ru/index.php?param1=dsfds¶m2=3, тогда Allow: /index.php* вполне хватило бы...
т.е. у вас прописанно подменятьь ддинамические урлы статическими... Для такой схемы достаточно прописать что-то вида: Allow: /word/
Только и в том и другом случае, если нужна индексация картинок и т.п. нужно посмотреть по какому адресу их CMS прописала и тот каталог тоже разрешить...
Aveter, у вас все линки на страницы идут типа
site.ru/index.php?param1=dsfds¶m2=3
т.е. по сути идет обращение только к одной странице, на которой контент уже генерится автоматически, в зависимости от переданных параметров... А как и откуда контент появляется на вашей странице ПС откровенно говоря не должно... Так что разрешена должна быть эта страница, а остальное уже хозяин - барин...
hippis, Делайте сайты хоть немного интерестными для людей и не перелинковывайте их и проблем быть не должно...
Хостинг один, а аккаунты могут быть и совершенно разные... Поэтому я бы сказал наоборот, если сайт белый и пушистый, то лучше выделенный, чтобы не расплачиваться за чужие грехи...
Можно сохраняя классическую структуру сайта просто при входе пользователя на главную проверять, установлены ли у него куки, и если не установлены или истекли, устанавливать ему новые куки и редиректить его на входную страницу. И входную страницу получите и никаких особенностей продвижения...
Законов мы никаких не нарушаем, а нарушаем правила, которые устанавливают ПС, мол не мешайте нам, мы разберемся сами, а не желаете, тогда мы вас «искать» не будем. Вот и все…
Получается, что остается только моральная сторона дела, поэтому у разговор такой жаркий. Да было бы хорошо, если бы контент определял все, ПС не трогали бы наши ссылки и в интернете царили бы покой и порядок. Но реалии таковы, что уязвимость существующего алгоритма ссылочного ранжирования заспамливанью, заставляет и более или менее порядочных оптимизаторов использовать играть по серым правилам.
С одной стороны грустно, что рулит спам, а не контент, с другой – это ведь наш хлеб (ради бога, а не пропагандирую спам, но грубо говоря увеличение ссылочного – тоже спам). Вот и получается, что нас настоятельно попросили, а решать в конечном счете нам, что нам дороже, чистая совесть или позиции в топе.