Вопросы по поводу индексации страниц сайта

galaid
На сайте с 13.09.2011
Offline
16
478

Имеется сайт (движок не WP) следующей структуры:

  • главная страница - site.ru или site.ru/index.php;
  • страница с материалом - site.ru/?p=n;
  • страница категории - site.ru/?cat=n;
  • страница со списком более ранних материалов - site.ru/?page=n или site.ru/?cat=n&page=q (для категорий);

Весь контент подгружается из БД. Страницы состоят из блоков header.php, content.php, footer.php.

Вопросы:

  • следует ли настраивать файл robots.txt для корректной индексации сайта или же в данном случае ПС сами разберуться: что индексировать, а что нет?
  • следует ли как-то ограничивать индексацию несозданных страниц, вида site.ru/?p=n?
  • следует ли запрещать индексацию файлов header.php, content.php, footer.php?
Garin33
На сайте с 31.08.2009
Offline
169
#1

Закрывать от индексации php файлы не нужно.

В роботсе закрыть те места, в которых происходит дублирование контента, поисковики сами разбираться НЕ будут.

И определиться что является главной - site.ru или site.ru/index.php, и прописать соответствующий редирект, в зависимости от того, что выбрали главной страницей.

Потому что Drupal - это круто.
galaid
На сайте с 13.09.2011
Offline
16
#2

Ок, с этим вопросом более или менее разобрался.

Яндекс и Гугл ругается на такие страницы: site.ru/?p= или же site.ru/?cat=1&page= и тому подобное. Хотя я не понимаю, как они попали в индекс. Эту проблему можно как-то исправить?

И ещё, допустим сайт имеет страницы site.ru/?p=n (где n - числа от 1 до 9), то есть для n=10 страница как бы не будет сгенерирована. Можно ли в таком случае направлять посетителей на какую-нибудь заранее созданную site.ru/error.html? С посетителями, которые попали на страницы, описанные выше, поступать так же?

galaid добавил 13.11.2011 в 18:28

А эту страницу ошибок скрыть от индексации.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий