Yapy

Yapy
Рейтинг
2
Регистрация
30.01.2012

Кодировка сервера у вас тоже UTF-8, я так понимаю?

А какая кодировка у отдаваемых страниц сервером?

superf:
Как на ваш взгляд, все ли что нужно сделано?

Хм., ну как вам сказать, такую простыню просматривать и без исходников сложно. На первый взгляд действительно большинство закрытых страниц - служебные или дублирующий контент.

superf:
Я читал что в роботсе должно быть прописано, основное зеркало...а здесь вроде как нет.

Ну можете добавить, для яндекса.

Так же можно указать путь к карте .xml сайта, елси она есть.

anton831:
На разных движках вывод информации по разному осуществлен

Но если они выдают сходный хтмл-код, то какая разница?

anton831:
плюс если верстка не одинаковая, имена классов разные стили по разному оформлены и.т.д.
piratstvo:
имена стилей, названия картинок..

Думаю, что если яндекс и анализирует сходство дизайна, то анализ берётся более глубинное исследование кода, а не только название стилей и классов.

superf:
---а можно просто взять [...] и поставить на свой сайт...или его нужно очень аккуратно создавать?

Для большинства случаев должно подойти, но возможны подводные камни.

1) Некоторые страницы так и останутся дублями, индивидуальность играет роль всё-таки.

2) Можно закрыть нужные страницы. Например, тот же индекс.пхп, про который говорится в статье. Но у вас в меню ссылки без него (посмотрел 2 пункта меню), то есть закрывать можно.

Да, ну и, разумеется, директиву Host: ввв.HOST.ru, которая в самом конце, либо убрать, либо изменить на свой сайт.

superf:
Что нужно сделать чтобы избежать такого рода дублей.

При создании сложных сайтов подобные дубли возникают всегда, поскольку, как правило, одну и ту же страницу возникает необходимость вызывать различными способами: по дате, тегам, id и т.д. Решить ваш вопрос поможет правильное составление /роботс.тхт. Ну и судя по вашему нынешнему роботс, дубли там не закрыты.

superf:
Программисту некогда пока заняться поиском дублей, а я переживаю...утром вместо 102000 страниц, в индексе гугл показал 7000, в обед вернулось вроде 102000, но кто его знает, может скоро уйдут и навсегда.

Хм., после "разборок" с дублями количество страниц тоже должно упасть, а вот процент проиндексированных не под фильтрами вырасти.

ANNA24, да, покажите лучше исходник, а по ошибке одной так и не скажешь. Возможно, банальное нарушение синтаксиса, которое порой сложно отследить. Причём оно может быть не на именно той строке, в которой парсер выдаёт ошибку.

ANNA24:
всё же верно..

$header['description'] = 'ˠ衯

Хм., точка с запятой, ковычка??

1 234
Всего: 36