Google индексирует страницы ?replytocom в WordPress. Что с ними делать?

123 4
SZ
На сайте с 09.07.2011
Offline
158
1144

Привет! После того как Google перестал обращать внимание на файл robots.txt в индекс залетело много страницы формата "url/ ?replytocom=193862". Это ссылки которые WordPress генерирует для кнопки "Ответить на комментарий". На этих страницах прописан canonical на основную статью.

Я убрал запрет на индексацию в robots.txt и добавил на эти страницы noindex. Понятно, что сильно выросло число страниц с тегом noindex в GSC. Пока с 7к до 20к. Что, как мне кажется, не очень хорошо.

Вопрос в том, что с ними делать? Вижу такие варианты:

  1. Оставить на этих страницах noindex. Но это не на всех сайтах получается сделать, не все плагины (типа Yoast) это умеют.
  2. Не добавлять noindex. Тогда эти страницы в GSC вроде как уходят в раздел "Вариант страницы с тегом canonical".
  3. Сделать так, чтобы  WordPress не генерировал эти страницы. Идеальный вариант. Но как? И что делать с теми страницами, которые Google уже увидел? Может кто подскажет. Видел сайты на WordPress, на которых когда наводишь на ссылку ответа на комментарий там просто "url/#", а не "url/ ?replytocom=193862#respond".



lkm
На сайте с 16.03.2012
Offline
366
lkm
#1
Webcraftic Clearfy - SEO - Дубли страниц -  Удалить ?replytocom
SZ
На сайте с 09.07.2011
Offline
158
#2
lkm #:
Webcraftic Clearfy - SEO - Дубли страниц -  Удалить ?replytocom

Спасибо. Не хотелось бы использовать отдельный плагин для этого.

Vladimir SEO
На сайте с 19.10.2011
Offline
1945
#3

3 вариант

SeraZwer :
И что делать с теми страницами, которые Google уже увидел?
ничего - 404 или 410
Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/
OS_ZP_UA
На сайте с 24.04.2018
Offline
86
#4
Vladimir SEO #:

3 вариант

ничего - 404 или 410

Уйдет в отчет "Ложная ошибка 404", что не очень хорошо.

Я в  noindex отправил, и открыл доступ в  robots.txt, как это рекомендовано Гуглом. Но по сути это глюк, который появился после август-сентябрьского АПа ядра.

Vladimir SEO
На сайте с 19.10.2011
Offline
1945
#5
OS_ZP_UA #:
Уйдет в отчет "Ложная ошибка 404"
почему в софт 404 ?
OS_ZP_UA #:
что не очень хорошо.

чем именно ?

OS_ZP_UA #:
Я в  noindex отправил, и открыл доступ в  robots.txt, как это рекомендовано Гуглом
ну так 20к страниц теперь в обходе и на них расход квоты идет ( 
OS_ZP_UA
На сайте с 24.04.2018
Offline
86
#6
Vladimir SEO #:
почему в софт 404 ?

чем именно ?

ну так 20к страниц теперь в обходе и на них расход квоты идет ( 

Ну потому что наличие на странице ссылки, на страницу которая отдает 404, это не очень хорошо, я думаю все согласятся что на страницах не должно быть битых ссылок. А Гугл теперь год будет переобходить все те страницы, на которых он увидел ссылки на коментарии такого рода.

20к страниц уже в обходе, и на них уже квота идет.

Как по мне, то правильней не показать Гуглу что у тебя куча битых ссылок, а именно показать, что страница существует, но ты не хочешь чтобы Гугл ее индексировал, тем более сам Гугл именно это рекомендует сделать.

OS_ZP_UA
На сайте с 24.04.2018
Offline
86
#7
А, и да, если страницу отдать как 404 только Гуглботу (а это всетаки проблема именно Гугла, а не остальных ПС), а я так изначально сделал, то те страницы на которых есть даже минимальная посещаемость, уходят в  "Ложная ошибка 404", видимо Хром стучит.
Vladimir SEO
На сайте с 19.10.2011
Offline
1945
#8
OS_ZP_UA #:

Ну потому что наличие на странице ссылки, на страницу которая отдает 404, это не очень хорошо, я думаю все согласятся что на страницах не должно быть битых ссылок. А Гугл теперь год будет переобходить все те страницы, на которых он увидел ссылки на коментарии такого рода.

а кто говорит что оставить ссылку на 404 ? и главное зачем ее оставлять ? естественно в третьем варианте допилить вп надо не только что бы не генерил страницы - но и ссылки на них. Мало того их и в коде не должно быть не только в видимой части сайта.

OS_ZP_UA #:
20к страниц уже в обходе, и на них уже квота идет.

ну да вместо нормальных страниц

OS_ZP_UA #:
а именно показать, что страница существует,

я показываю что не сущесвует и все ок

OS_ZP_UA #:
видимо Хром стучит.
стучит и еще как
OS_ZP_UA
На сайте с 24.04.2018
Offline
86
#9
Vladimir SEO #:
а кто говорит что оставить ссылку на 404 ? и главное зачем ее оставлять ? естественно в третьем варианте допилить вп надо не только что бы не генерил страницы - но и ссылки на них. Мало того их и в коде не должно быть не только в видимой части сайта.

Ты представляешь сколько Гугл будет пересканировать все эти страницы, которые он просканировал со ссылкой на  replytocom=ххххххх, учитывая что там номера уже шестизначные? Он все эти ссылки видел, просто учитывал  robots.txt и не пытался их взять в индекс. Теперь, на то чтобы убедить Гугл что таких ссылок на сайте нет, уйдут годы.  Ну тоесть на 20% хорошо посешаемых страниц, он пересканирует за месяц, а на остальных 80% низкопосещаемых, будет висеть годами, уходя по 100 страниц в неделю. И все эти годы Гугл будет считать что у тебя куча страниц с битыми ссылками.

Vladimir SEO
На сайте с 19.10.2011
Offline
1945
#10
OS_ZP_UA #:

Ты представляешь сколько Гугл будет пересканировать все эти страницы, которые он просканировал со ссылкой на  replytocom=ххххххх, учитывая что там номера уже шестизначные? Он все эти ссылки видел, просто учитывал  robots.txt и не пытался их взять в индекс. Теперь, на то чтобы убедить Гугл что таких ссылок на сайте нет, уйдут годы.  Ну тоесть на 20% хорошо посешаемых страниц, он пересканирует за месяц, а на остальных 80% низкопосещаемых, будет висеть годами, уходя по 100 страниц в неделю. И все эти годы Гугл будет считать что у тебя куча страниц с битыми ссылками.

какая разница сколько он будет пересканировать - страниц нет, ссылок на них нет, тут нету софт 404. Отдаем 410 и все, пусть себе сканирует. Главное сайт допилить нормально.

ТС же сказал что рост с 7к до 20к в ноиндексе. Квота уходит, сайт недопилен. Данных кстати о посещаемости страниц с ссылками на коменты ТС не давал.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий