Много дублей страниц

12
S6
На сайте с 26.12.2011
Offline
31
1122

Всем здравствуйте . У меня появились на сайте откуда то дубли страниц с разными цифрами на конце. Только в Яндексе, в Гугле все нормально.Подскажите что это может быть и как исправить?

Сергей (http://naotduhe.ru/)
A
На сайте с 20.08.2010
Offline
775
#1

Настроить надо канонические урлы и желательно включить запрет передачи всех ссылок в метрике, который наверняка включен.

W
На сайте с 21.01.2009
Offline
172
#2
seriy64:
Всем здравствуйте . У меня появились на сайте откуда то дубли страниц с разными цифрами на конце. Только в Яндексе, в Гугле все нормально.Подскажите что это может быть и как исправить?

В первую очередь стоит разобраться как сделать, что бы сайт не создавал такие дубли страницы и откуда на них ведут ссылки.

Сделать что бы несуществующие страницы отдавали ошибку 404 и удалить из все из индекса Яндекса.

A
На сайте с 20.08.2010
Offline
775
#3
weblad:
В первую очередь стоит разобраться как сделать, что бы сайт не создавал такие дубли страницы и откуда на них ведут ссылки.
Сделать что бы несуществующие страницы отдавали ошибку 404 и удалить из все из индекса Яндекса.

Нельзя на вп запрещать такие страницы. Вернее, можно, но нежелательно. Настраиваются канонические урлы и все, проблема решена.

W
На сайте с 21.01.2009
Offline
172
#4

awasome, а то что на сайте останется много дублей страниц это нормально? Мне кажется нет.

Проблем в WordPress с запрещением дублей не встречал, мы с ним очень плотно работаем, с десятками проектов.

A
На сайте с 20.08.2010
Offline
775
#5
weblad:
awasome, а то что на сайте останется много дублей страниц это нормально? Мне кажется нет.

Это особенность вп. По-умолчанию такие страницы с цифрами не отдают 404, а значит, нехороший бот может нагенерить миллион дублей. Раньше генерились и буквы, потом в каком-то из обновлений эту дырку закрыли, стал отдавать 404. Лечится каноническими урлами, либо закрытием цифр в роботсе или htaccess. Первый вариант проще и удобнее.

weblad:

Проблем в WordPress с запрещением дублей не встречал, мы с ним очень плотно работаем, с десятками проектов.

Потому что до вас еще не дошли. Мне на некоторых сайтах периодически пытаются генерить, но канонические урлы решают. Другие сайты не трогают даже.

W
На сайте с 21.01.2009
Offline
172
#6

awasome, да, вы правы, с такими дублями знаком, но закрываться от них не приходилось, не было необходимости. Но все равно, я бы не спал спокойно пока они есть :)

По идее должны быть какие-то еще варианты защиты, например проверять совпадает ли url обращения к серверу с slug страницы к которой обращаются.

S6
На сайте с 26.12.2011
Offline
31
#7
weblad:
awasome, да, вы правы, с такими дублями знаком, но закрываться от них не приходилось, не было необходимости. Но все равно, я бы не спал спокойно пока они есть :)
По идее должны быть какие-то еще варианты защиты ?????????????

Вот и я спокойно перестал спать когда такое обнаружил.

Не знаю с чего нужно начинать чтобы избавиться от этих циферок в конце.

Вы говорите удалить, это по одной странице если удалять, где то около 10000 страниц -

до следующего Нового года справлюсь.

Давайте потихоньку разберемся. Где проблема и как ее решить?

awasome подсказывает, что лечится каноническими урлами, либо закрытием цифр в роботсе или htaccess.

Я так понимаю в настройках плагина All in One SEO Pack. У меня стоит галочка в строке

Канонические URL:

И в настройках индексирования тоже галочки стоят в ниже указанных строках:

Использовать noindex для рубрик:

Использовать noindex для архивов дат:

Использовать noindex для архивов авторов:

Использовать noindex для архивов меток:

Использовать noindex для страницы поиска:

W
На сайте с 21.01.2009
Offline
172
#8

seriy64, попробуйте спросить в разделе Веб строительство, в теме про WordPress, возможно кто то сталкивался с такой задачей и поделится кодом

По удалению страниц из индекса, насколько я знаю никаких автоматизированных инструментов для этого нет, если их 10 тыс. возможно проще дождаться когда они сами из индекса выпадут, это должно занять 1-3 месяца

A
На сайте с 20.08.2010
Offline
775
#9
seriy64:

Я так понимаю в настройках плагина All in One SEO Pack. У меня стоит галочка в строке
Канонические URL:

Если не ошибаюсь, надо поставить дополнительную галку в пункте запрета пагинации для канонических страниц.

seriy64:

Вы говорите удалить, это по одной странице если удалять, где то около 10000 страниц -
до следующего Нового года справлюсь.

Что бы их удалить, надо сначала сделать так, что бы они отдавали 404 ответ.

S6
На сайте с 26.12.2011
Offline
31
#10

Это мне снова создать тему в разделе Веб строительство, в теме про WordPress или как??

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий