Разработчик, в основном - к топикстартеру.
Если по определенным запросам Google сейчас демонстрирует более качественный поиск, то он очень быстро скатится до нынешнего уровня качества поиска в Яндексе, как только русскоязычные сайты начнут активно оптимизировать именно под Google, в первую очередь.
1000 раз уже обсуждалось. Зачем снова это обмусоливать.
Тема для курилки.
Прекратите рыть могилу курице, которая несет золотые яйца.
С Яндекса идет почти 100% русскоязычный траффик, а с Google приходит до 50% импортного и бесполезного.
<h1>Синий слон</h1>
...
<h2>Синий слон: описание</h2>
<h2>Синий слон: технические характеристики</h2>
<h2>Синий слон: отзывы посетителей</h2>
Все тайное, рано или поздно, становится явным ;_)
Пока это только гипотеза - требуется эксперимент.
Положим, берется файловый архив, представляющий собой ни что иное, как каталог инструкций, используемый одним или несколькими интернет-магазинами. Ссылка на инструкцию, как правило, содержится в карточках товаров. Если у нас несколько интернет-магазинов, построенных на единой базе, которую мы переодически синхронизируем с датацентром, никто не мешает создать отдельный домен для вышеуказанных целей и профилю, где будут храниться все инструкции, в открытом доступе через http.
В скрипте всех магазинов мы ставим ссылку на файлы с инструкциями с этого домена (даже если магазины находятся на различных серверах). Ссылки, вдобавок, делаем текстовыми, в анкоре - полное имя файла.
Файлы с инструкциями должны быть именованы таким образом, чтобы посетитель, зашедший на домен с документами мог бы интуитивно определить, что это за файл и к чему относится. Более того, это требуется для того, чтобы сохранить его на диске локального компьютера и, при необходимости, легко найти.
Редактируем шаблон индексных страниц сервера таким образом (если возможно, еще не смотрел), чтобы имя файла не обрезалось на ~21 символе конструкцией вида ..> . Если и не возможно, именуем их по прототипу Брэнд_модель.(pdf)
Обращаем внимание и на то, что в <h1></h1> и <title></title> содержится относительный путь до выбранной директории.
Получаем прекрасную страницу вида:
<title>Sony/LCD_телевизоры</title>
<h1>Sony/LCD_телевизоры</h1>
а).
LCD_телевизор_Sony_x1111xx.pdf
LCD_телевизор_Sony_x1112xx.pdf
LCD_телевизор_Sony_x1113xx.pdf
LCD_телевизор_Sony_x9999xx.pdf
b).
Sony_x1111xx.pdf
Sony_x1112xx.pdf
Sony_x1113xx.pdf
Sony_x9999xx.pdf
Оцениваем плотность ключевиков на странице, и вспоминаем, как в просторечии называются сайты со сверх-высокой плотностью ключевых слов.
Сразу понимаем и разницу, и что наш сайт все-таки показывает посетителю востребованную им информацию (и перенаправлять его автоматом в Космос отсюда не надо).
Надеюсь, можно изменить шаблон и footer'а этих страниц
Apache/2.0.59 (FreeBSD) PHP/5.1.6 Server at www.ххххх.yyy Port 80
на что-то более полезное, например красивый баннер и ссылку на датацентр
(с) 1998-2006 Проект <a>Супер-пупер торговой системы РОГА и КОПЫТА</a> - мы продаем лучшую <a>лапшу на уши</a> в России.
Но еще лучше:
Подробную информацию по <a><b>Sony/LCD_телевизоры</b></a> вы найдете на сайте <a>Супер-пупер торговой системы РОГА и КОПЫТА</a>
А сами страницы усилить дополнительными ссылками с интернет-магазинов:
Посмотреть весь каталог <a>Инструкций на Sony/LCD_телевизоры</a>
ИТОГО ... может получиться вполне легальный сайт с большим траффиком, известностью и передачей накапливаемого веса сайту дата-центра.
Художественный примитивизм, короче говоря =)
P.S.: под такую затею (пару раз надо еще подумать о концепции) можно, при необходимости, и исходники Apache подправить.
ОК. Я даже уже придумал, как это можно использовать в "мирных целях" :p
А как же, причем дают очень красивый ответ:
Если там лежат полезные людям инструкции - сайт полезен людям. Но так как ВСЕ страницы созданы автоматически самим сервером - возможности влиять на выдачу и т.п. из п. 3.5 ... НЕТ и НЕ БУДЕТ!
На всякий случай поясню:
на сайте нет ни одной страницы, но есть иерархия директорий и файлы форматов .doc, .pdf в них.
В .htaccess пишем Options +Indexes, и черный ящик почти готов. Как сделать много внешних ссылок на эти документы - вопрос техники.
Я понимаю, что без '/', но кто мешает Яндексу случайно запутаться в стандартах.
Короче говоря, на этот вопрос точно может ответить только Платон - что это такое: бан, пессимизация или все вместе. (Похоже на последнее)
ОФФ - в половину шестого, при свечах, можно и покруче очепятаться. :p
Погоди, я типа понял - посмотри на robots.txt сайта http://moneygames42.ru_
Или меня глюки? =)
Обрати внимание на Disallow: index.php