Google индексирует страницы ?replytocom в WordPress. Что с ними делать?

160

SeraZwer

14 октября 2024, 09:07

1358

Привет! После того как Google перестал обращать внимание на файл robots.txt в индекс залетело много страницы формата "url/ ?replytocom=193862". Это ссылки которые WordPress генерирует для кнопки "Ответить на комментарий". На этих страницах прописан canonical на основную статью.

Я убрал запрет на индексацию в robots.txt и добавил на эти страницы noindex. Понятно, что сильно выросло число страниц с тегом noindex в GSC. Пока с 7к до 20к. Что, как мне кажется, не очень хорошо.

Вопрос в том, что с ними делать? Вижу такие варианты:

Оставить на этих страницах noindex. Но это не на всех сайтах получается сделать, не все плагины (типа Yoast) это умеют.
Не добавлять noindex. Тогда эти страницы в GSC вроде как уходят в раздел "Вариант страницы с тегом canonical".
Сделать так, чтобы WordPress не генерировал эти страницы. Идеальный вариант. Но как? И что делать с теми страницами, которые Google уже увидел? Может кто подскажет. Видел сайты на WordPress, на которых когда наводишь на ссылку ответа на комментарий там просто "url/#", а не "url/ ?replytocom=193862#respond".

366

lkm

14 октября 2024, 09:09

#1

Webcraftic Clearfy - SEO - Дубли страниц - Удалить ?replytocom

SZ

160

SeraZwer

14 октября 2024, 10:50

#2

lkm #:
Webcraftic Clearfy - SEO - Дубли страниц - Удалить ?replytocom

Спасибо. Не хотелось бы использовать отдельный плагин для этого.

1992

Vladimir SEO

14 октября 2024, 10:59

#3

3 вариант

SeraZwer :
И что делать с теми страницами, которые Google уже увидел?

ничего - 404 или 410

Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/

91

OS_ZP_UA

14 октября 2024, 12:15

#4

Vladimir SEO #:

3 вариант

ничего - 404 или 410

Уйдет в отчет "Ложная ошибка 404", что не очень хорошо.

Я в noindex отправил, и открыл доступ в robots.txt, как это рекомендовано Гуглом. Но по сути это глюк, который появился после август-сентябрьского АПа ядра.

Что за бяка? Апдейт поисковой базы 01.09.2015 Товар.партнерка №1. Все хиты.

1992

Vladimir SEO

14 октября 2024, 12:50

#5

OS_ZP_UA #:
Уйдет в отчет "Ложная ошибка 404"

почему в софт 404 ?

OS_ZP_UA #:
что не очень хорошо.

чем именно ?

OS_ZP_UA #:
Я в noindex отправил, и открыл доступ в robots.txt, как это рекомендовано Гуглом

ну так 20к страниц теперь в обходе и на них расход квоты идет (

91

OS_ZP_UA

14 октября 2024, 13:11

#6

Vladimir SEO #:
почему в софт 404 ?

чем именно ?

ну так 20к страниц теперь в обходе и на них расход квоты идет (

Ну потому что наличие на странице ссылки, на страницу которая отдает 404, это не очень хорошо, я думаю все согласятся что на страницах не должно быть битых ссылок. А Гугл теперь год будет переобходить все те страницы, на которых он увидел ссылки на коментарии такого рода.

20к страниц уже в обходе, и на них уже квота идет.

Как по мне, то правильней не показать Гуглу что у тебя куча битых ссылок, а именно показать, что страница существует, но ты не хочешь чтобы Гугл ее индексировал, тем более сам Гугл именно это рекомендует сделать.

мнение о работе веб-студии?? Битые входящие ссылки Уникальный сайт с тиц

91

OS_ZP_UA

14 октября 2024, 13:16

#7

А, и да, если страницу отдать как 404 только Гуглботу (а это всетаки проблема именно Гугла, а не остальных ПС), а я так изначально сделал, то те страницы на которых есть даже минимальная посещаемость, уходят в "Ложная ошибка 404", видимо Хром стучит.

Гугл Хром не хочет Как правильно организовать "отдачу" Ускориться ли индексация ссылок?

1992

Vladimir SEO

14 октября 2024, 16:15

#8

OS_ZP_UA #:

Ну потому что наличие на странице ссылки, на страницу которая отдает 404, это не очень хорошо, я думаю все согласятся что на страницах не должно быть битых ссылок. А Гугл теперь год будет переобходить все те страницы, на которых он увидел ссылки на коментарии такого рода.

а кто говорит что оставить ссылку на 404 ? и главное зачем ее оставлять ? естественно в третьем варианте допилить вп надо не только что бы не генерил страницы - но и ссылки на них. Мало того их и в коде не должно быть не только в видимой части сайта.

OS_ZP_UA #:
20к страниц уже в обходе, и на них уже квота идет.

ну да вместо нормальных страниц

OS_ZP_UA #:
а именно показать, что страница существует,

я показываю что не сущесвует и все ок

OS_ZP_UA #:
видимо Хром стучит.

стучит и еще как

Как Яндекс реагирует на XAP-IV продолжение следует Как правильно настроить 404?

91

OS_ZP_UA

14 октября 2024, 17:14

#9

Vladimir SEO #:
а кто говорит что оставить ссылку на 404 ? и главное зачем ее оставлять ? естественно в третьем варианте допилить вп надо не только что бы не генерил страницы - но и ссылки на них. Мало того их и в коде не должно быть не только в видимой части сайта.

Ты представляешь сколько Гугл будет пересканировать все эти страницы, которые он просканировал со ссылкой на replytocom=ххххххх, учитывая что там номера уже шестизначные? Он все эти ссылки видел, просто учитывал robots.txt и не пытался их взять в индекс. Теперь, на то чтобы убедить Гугл что таких ссылок на сайте нет, уйдут годы. Ну тоесть на 20% хорошо посешаемых страниц, он пересканирует за месяц, а на остальных 80% низкопосещаемых, будет висеть годами, уходя по 100 страниц в неделю. И все эти годы Гугл будет считать что у тебя куча страниц с битыми ссылками.

Google Updates - апдейты GoGetLinks.net: ссылки навсегда на Понижается ли раздача в

1992

Vladimir SEO

14 октября 2024, 17:38

#10

OS_ZP_UA #:

Ты представляешь сколько Гугл будет пересканировать все эти страницы, которые он просканировал со ссылкой на replytocom=ххххххх, учитывая что там номера уже шестизначные? Он все эти ссылки видел, просто учитывал robots.txt и не пытался их взять в индекс. Теперь, на то чтобы убедить Гугл что таких ссылок на сайте нет, уйдут годы. Ну тоесть на 20% хорошо посешаемых страниц, он пересканирует за месяц, а на остальных 80% низкопосещаемых, будет висеть годами, уходя по 100 страниц в неделю. И все эти годы Гугл будет считать что у тебя куча страниц с битыми ссылками.

какая разница сколько он будет пересканировать - страниц нет, ссылок на них нет, тут нету софт 404. Отдаем 410 и все, пусть себе сканирует. Главное сайт допилить нормально.

ТС же сказал что рост с 7к до 20к в ноиндексе. Квота уходит, сайт недопилен. Данных кстати о посещаемости страниц с ссылками на коменты ТС не давал.

Отслеживание цен Ответ сайта 410 - Нужна помощь по файле

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Зачем быть уникальным в мире, где все можно скопировать