Кодировка сервера у вас тоже UTF-8, я так понимаю?
А какая кодировка у отдаваемых страниц сервером?
Хм., ну как вам сказать, такую простыню просматривать и без исходников сложно. На первый взгляд действительно большинство закрытых страниц - служебные или дублирующий контент.
Ну можете добавить, для яндекса.
Так же можно указать путь к карте .xml сайта, елси она есть.
Но если они выдают сходный хтмл-код, то какая разница?
Думаю, что если яндекс и анализирует сходство дизайна, то анализ берётся более глубинное исследование кода, а не только название стилей и классов.
Для большинства случаев должно подойти, но возможны подводные камни.
1) Некоторые страницы так и останутся дублями, индивидуальность играет роль всё-таки.
2) Можно закрыть нужные страницы. Например, тот же индекс.пхп, про который говорится в статье. Но у вас в меню ссылки без него (посмотрел 2 пункта меню), то есть закрывать можно.
Да, ну и, разумеется, директиву Host: ввв.HOST.ru, которая в самом конце, либо убрать, либо изменить на свой сайт.
При создании сложных сайтов подобные дубли возникают всегда, поскольку, как правило, одну и ту же страницу возникает необходимость вызывать различными способами: по дате, тегам, id и т.д. Решить ваш вопрос поможет правильное составление /роботс.тхт. Ну и судя по вашему нынешнему роботс, дубли там не закрыты.
Хм., после "разборок" с дублями количество страниц тоже должно упасть, а вот процент проиндексированных не под фильтрами вырасти.
ANNA24, да, покажите лучше исходник, а по ошибке одной так и не скажешь. Возможно, банальное нарушение синтаксиса, которое порой сложно отследить. Причём оно может быть не на именно той строке, в которой парсер выдаёт ошибку.
Хм., точка с запятой, ковычка??