SAN, .htaccess - это конфигурационной файл для апача. Его действие распространяется на каталог, в котором он находится, и на вложенные каталоги, если там нет других .htaccess.
Алексей, я не буду расписывать в форуме, как и что можно сделать, потому что получится долго и нудно :) Если хотите, сброшу по мылу небольшой хелп на русском.
SAN, если группы товаров у вас разложены по директориям, можно в каждой из них прописать в .htaccess свою страницу для 404. А если нет, то можно написать обработчик ошибок.
Ибо есть яндекс. Да и привычки дело :)
И статьи тоже почитайте.
ZanderXML, есть и в минус :(
alex-xl, да, фактически вы сделали дорвей. Спам это или нет будут решать сотрудники поисковика.
Впрочем, раз уж яндексоиды из каталога смотрели ваш сайт и вы еще не в бане, значит не спам :)
1. Да.
2. Не все поисковики любят динамические страницы. Так что смысл есть.
3. Есть мнение, что лучше всего html. Сам закономерностей связанных с расширением не наблюдал, так что ИМХО все равно.
4. Отрицательно нет, положительно тоже нет :) Буржуйские поисковики вроде бы обращают внимание на названия страниц (имена файлов), т.е. например названия вроде motorcycle.html или roadster.html дадут дополнительный вес соответствующим запросам. Нашему же яндексу все равно обзовете вы страницу amortizator_kompressora.phtml или qwerty.phtml. А со смыслом лучше давать, чтобы самому не запутаться в куче файлов.
Вы хотите мониторить позиции страниц в выдаче поисковых систем? Или просто наличие страниц в базе?
pups, домен один, порты разные.
Chernoff, попробуйте прописать в robots.txt основное зеркало с 80-ым портом. Остальные порты по идеи должны запретиться к индексированию. http://www.yandex.ru/info/webmaster2.html
Кстати, зачем у вас вообще другие порты открыты? Отдаете по ним разную инфу?
Вы хотите сказать, что если я, например, публикую у себя на сайте какую-нибудь статью из другого источника, то она может быть склеена с оригиналом?