Если недоступна каноническая страница, то она гарантированно попадает в индекс - Веб-строительство

Что нужно сделать чтобы запретить Гуглу и Яндексу индексировать постраничную навигацию?

Дмитрий2017 · 2017-08-27T19:04:24.0000000Z

Если я правильно понимаю, для Яндекса достаточно добавить в файл robots.txt движка Wordpress директиву Disallow: /*page* Дубли в выдачу попадать не будут. А вот с Гуглом немного посложнее. Он заявляет, что файл robots.txt носит исключительно рекомендательный характер. Чтобы угодить двум поисковым системам, вот что я сделал: 1). Убрал из файла robots.txt директиву Disallow: /*page* 2). На всех страницах постраничной навигации, между тегами "head", прописал мета-тег: <meta name="robots" content="noindex,nofollow"/> Все ли я сделал правильно? Спасибо!

135

dotern

30 августа 2017, 11:15

#21

burunduk:
с ним проблем намного больше, начиная с того что его ещё правильно прописать надо и заканчивая тем, что пс его не учитывают если канонический url недоступен и/или "существенно отличается" ;)

Никаких проблем не существует, если правильно настроить и прописать, согласен. Собственно, так в любом деле☝

Вот у меня есть сайт, там статьи очень длинные, каждый материал разбивается на пагинацию, в таком виде:

site.com/katalog/avtor/nazvanie-materiala - url первой и главной страницы статьи, внизу страницы пагинация с такими url:

site.com/katalog/avtor/nazvanie-materiala?start=2 - это вторая страница статьи. Плагин джумлы добавляет на такую страницу тег <link href="site.com/katalog/avtor/nazvanie-materiala" rel="canonical"/> таким образом робот видит эту страницу и имеет доступ к ней, но тег каноникал говорит роботу, что это дубль первой страницы и робот добавляет в выдачу только каноническую страницу.

base href и rel="canonical" Дубли URL в Drupal, Яндекс не дает позиции

S

469

Sitealert

30 августа 2017, 12:15

#22

dotern:
Плагин джумлы добавляет на такую страницу тег

Для того, чтобы прописать пару строк в хэдере, нинах не нужен плагин, и не только в джумле.

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.

[Удален]

30 августа 2017, 12:23

#23

dotern:
site.com/katalog/avtor/nazvanie-materiala?start=2

а что будет в каноникле на такой странице: site.com/kataloG/avtor/nazvanie-materiala?start=2

или на такой site.com/katalog/avtor/nazvanie-materiala?site1.com&start=2

а что будет если страница site.com/katalog/avtor/nazvanie-materiala была недоступна при сканировании роботом, а если на неё есть ещё и внешние ссылки

что окажется в индексе? ;)

[Удален]

30 августа 2017, 12:24

#24

Sitealert:
Для того, чтобы прописать пару строк в хэдере,

вообще-то, там целый модуль нужен ;)

135

dotern

30 августа 2017, 12:44

#25

Sitealert:
Для того, чтобы прописать пару строк в хэдере, нинах не нужен плагин, и не только в джумле.

Он там стандартно стоит, просто включить нужно, джумла продумала этот момент, потому как пагинация также входит в стандартный набор. Вручную прописывал тег alternate, который показывает роботу, что есть такая же страница для мобильных устройств.

burunduk:
а что будет в каноникле на такой странице: site.com/kataloG/avtor/nazvanie-materiala?start=2
или на такой site.com/katalog/avtor/nazvanie-materiala?site1.com&start=2

что окажется в индексе? ;)

на таких страницах плагин джумлы выставляет правильный каноникал, только что проверил (также ответ на сообщение Sitealert, почему лучше включить штатный плагин). А вообще это очередная болезнь дублей на движках, лечится еще одним плагином, который выставляет 301 редирект на подобные страницы и у меня на такие страницы даже нельзя зайти.

burunduk:

а что будет если страница site.com/katalog/avtor/nazvanie-materiala была недоступна при сканировании роботом, а если на неё есть ещё и внешние ссылки

Вот тут не понял, почему она может быть недоступна?

Что лучше, адаптивный дизайн Откуда взялись эти страницы Массовый 301 редирект в

[Удален]

30 августа 2017, 12:49

#26

dotern:
на таких страницах плагин джумлы выставляет правильный каноникал, только что проверил. А вообще это очередная болезнь дублей на движках, лечится еще одним плагином, который выставляет 301 редирект на подобные страницы и у меня на такие страницы даже нельзя зайти.

здоровых людей нет - есть не до обследованные ;)

dotern:
Вот тут не понял, почему она может быть недоступна?

вариантов куча, от банального сбоя на хостинге, до бага робота и то и другое происходит регулярно :)

а если есть ещё и внешние ссылки на неконаническую страницу, то она гарантированно попадает в индекс

Влияние подмены урлов с Яндекс не жрёт больше Как определить что донор

135

dotern

30 августа 2017, 13:00

#27

burunduk:
здоровых людей нет - есть не до обследованные ;)

У меня всё в порядке, 5 лет уже в деле))

burunduk:

вариантов куча, от банального сбоя на хостинге, до бага робота и то и другое происходит регулярно :)

Свой сервак, давно уже тесно на хостинге, также стоят системы мониторинга, я так понимаю, вы про сбой всего сервера, а не про недоступность конкретной страницы? Почему может недоступна именно каноническая страница я так и не понял.

burunduk:

а если есть ещё и внешние ссылки на неконаническую страницу, то она гарантированно попадает в индекс

Именно в индекс, то есть в поисковую выдачу? По идее робот должен увидеть, что это дубль другой страницы и только ее добавить в выдачу. А вообще, если что-то и попадет в индекс, то ничего страшного не вижу, долгое время сайт жил без каноникала, да все страницы попадали в индекс, но тем не менее ПС выставляли на самые высокие позиции именно первые страницы статьи.

rel=canonical и постраничная навигация Всегда нужно использовать rel="canonical" Сайт уже 2 месяца

[Удален]

30 августа 2017, 13:03

#28

dotern:
Именно в индекс, то есть в поисковую выдачу?

да, так основной там не будет ;)

dotern:
Почему может недоступна именно каноническая страница я так и не понял.

недоступность в момент обхода - обычное явление

135

dotern

30 августа 2017, 13:11

#29

burunduk:
да, так основной там не будет ;)

Робот перейдет по ссылке на дубль, увидит тег каноникал и добавит в индекс каноническую страницу.

burunduk:

недоступность в момент обхода - обычное явление

Эти явления появляются в google search console в разделе "ошибки сканирования", у меня таких явлений нет.

[Удален]

30 августа 2017, 13:36

#30

dotern:
Робот перейдет по ссылке на дубль, увидит тег каноникал и добавит в индекс каноническую страницу.

ещё раз, только при условии доступности страницы

dotern:
Эти явления появляются в google search console в разделе "ошибки сканирования"

да, но далеко не всегда

P.S. http://www.thesempost.com/google-ignores-canonicals-implemented-error/

So Google will try and save webmasters from themselves when they feel the rel canonical is in error and when other signals (such as the content not being identical or near-identical) seem to point in the direction that the canonicals are incorrect. That said, don’t assume Google will work out how these canonicals should be done, if they are done incorrectly, as signals could change in the future, and the canonicals Google had been ignoring could be followed in the future.

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Что нужно сделать чтобы запретить Гуглу и Яндексу индексировать постраничную навигацию?