Что нужно сделать чтобы запретить Гуглу и Яндексу индексировать постраничную навигацию?

1 234
dotern
На сайте с 21.09.2016
Offline
123
#21
burunduk:
с ним проблем намного больше, начиная с того что его ещё правильно прописать надо и заканчивая тем, что пс его не учитывают если канонический url недоступен и/или "существенно отличается" ;)

Никаких проблем не существует, если правильно настроить и прописать, согласен. Собственно, так в любом деле☝

Вот у меня есть сайт, там статьи очень длинные, каждый материал разбивается на пагинацию, в таком виде:

site.com/katalog/avtor/nazvanie-materiala - url первой и главной страницы статьи, внизу страницы пагинация с такими url:

site.com/katalog/avtor/nazvanie-materiala?start=2 - это вторая страница статьи. Плагин джумлы добавляет на такую страницу тег <link href="site.com/katalog/avtor/nazvanie-materiala" rel="canonical"/> таким образом робот видит эту страницу и имеет доступ к ней, но тег каноникал говорит роботу, что это дубль первой страницы и робот добавляет в выдачу только каноническую страницу.

S
На сайте с 30.09.2016
Offline
469
#22
dotern:
Плагин джумлы добавляет на такую страницу тег

Для того, чтобы прописать пару строк в хэдере, нинах не нужен плагин, и не только в джумле.

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.
[Удален]
#23
dotern:
site.com/katalog/avtor/nazvanie-materiala?start=2

а что будет в каноникле на такой странице: site.com/kataloG/avtor/nazvanie-materiala?start=2

или на такой site.com/katalog/avtor/nazvanie-materiala?site1.com&start=2

а что будет если страница site.com/katalog/avtor/nazvanie-materiala была недоступна при сканировании роботом, а если на неё есть ещё и внешние ссылки

что окажется в индексе? ;)

[Удален]
#24
Sitealert:
Для того, чтобы прописать пару строк в хэдере,

вообще-то, там целый модуль нужен ;)

dotern
На сайте с 21.09.2016
Offline
123
#25
Sitealert:
Для того, чтобы прописать пару строк в хэдере, нинах не нужен плагин, и не только в джумле.

Он там стандартно стоит, просто включить нужно, джумла продумала этот момент, потому как пагинация также входит в стандартный набор. Вручную прописывал тег alternate, который показывает роботу, что есть такая же страница для мобильных устройств.

burunduk:
а что будет в каноникле на такой странице: site.com/kataloG/avtor/nazvanie-materiala?start=2
или на такой site.com/katalog/avtor/nazvanie-materiala?site1.com&start=2

что окажется в индексе? ;)

на таких страницах плагин джумлы выставляет правильный каноникал, только что проверил (также ответ на сообщение Sitealert, почему лучше включить штатный плагин). А вообще это очередная болезнь дублей на движках, лечится еще одним плагином, который выставляет 301 редирект на подобные страницы и у меня на такие страницы даже нельзя зайти.

burunduk:

а что будет если страница site.com/katalog/avtor/nazvanie-materiala была недоступна при сканировании роботом, а если на неё есть ещё и внешние ссылки

Вот тут не понял, почему она может быть недоступна?

[Удален]
#26
dotern:
на таких страницах плагин джумлы выставляет правильный каноникал, только что проверил. А вообще это очередная болезнь дублей на движках, лечится еще одним плагином, который выставляет 301 редирект на подобные страницы и у меня на такие страницы даже нельзя зайти.

здоровых людей нет - есть не до обследованные ;)

dotern:
Вот тут не понял, почему она может быть недоступна?

вариантов куча, от банального сбоя на хостинге, до бага робота и то и другое происходит регулярно :)

а если есть ещё и внешние ссылки на неконаническую страницу, то она гарантированно попадает в индекс

dotern
На сайте с 21.09.2016
Offline
123
#27
burunduk:
здоровых людей нет - есть не до обследованные ;)

У меня всё в порядке, 5 лет уже в деле))

burunduk:

вариантов куча, от банального сбоя на хостинге, до бага робота и то и другое происходит регулярно :)

Свой сервак, давно уже тесно на хостинге, также стоят системы мониторинга, я так понимаю, вы про сбой всего сервера, а не про недоступность конкретной страницы? Почему может недоступна именно каноническая страница я так и не понял.

burunduk:

а если есть ещё и внешние ссылки на неконаническую страницу, то она гарантированно попадает в индекс

Именно в индекс, то есть в поисковую выдачу? По идее робот должен увидеть, что это дубль другой страницы и только ее добавить в выдачу. А вообще, если что-то и попадет в индекс, то ничего страшного не вижу, долгое время сайт жил без каноникала, да все страницы попадали в индекс, но тем не менее ПС выставляли на самые высокие позиции именно первые страницы статьи.

[Удален]
#28
dotern:
Именно в индекс, то есть в поисковую выдачу?

да, так основной там не будет ;)

dotern:
Почему может недоступна именно каноническая страница я так и не понял.

недоступность в момент обхода - обычное явление

dotern
На сайте с 21.09.2016
Offline
123
#29
burunduk:
да, так основной там не будет ;)

Робот перейдет по ссылке на дубль, увидит тег каноникал и добавит в индекс каноническую страницу.

burunduk:

недоступность в момент обхода - обычное явление

Эти явления появляются в google search console в разделе "ошибки сканирования", у меня таких явлений нет.

[Удален]
#30
dotern:
Робот перейдет по ссылке на дубль, увидит тег каноникал и добавит в индекс каноническую страницу.

ещё раз, только при условии доступности страницы

dotern:
Эти явления появляются в google search console в разделе "ошибки сканирования"

да, но далеко не всегда

P.S. http://www.thesempost.com/google-ignores-canonicals-implemented-error/

So Google will try and save webmasters from themselves when they feel the rel canonical is in error and when other signals (such as the content not being identical or near-identical) seem to point in the direction that the canonicals are incorrect. That said, don’t assume Google will work out how these canonicals should be done, if they are done incorrectly, as signals could change in the future, and the canonicals Google had been ignoring could be followed in the future.
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий