Бред с пагинацией в Гугле

60

dmitriy_xom

24 февраля 2018, 17:48

2220

Доброе время суток. Помогите пжл разобраться, в чем может быть проблема, суть: интернет магазин в нем есть стр. пагинации, закрыл их через мета тэг noindex но оставил чтобы робот мог переходить по товарам follow, проверю через оператор site: адрес первой стр. в гугле, результат: ( скрин: http://ibb.co/k5M7TH)

добавил + к выше перечисленому еще каноникал на 1 стр. все равно результат тот же, вариант закрыть вообще в robots.txt, но тогда робот не будет переходить по товарам на 2 и т.д страницах, помогите разобраться, почему гугл индексирует страницу, если стоит тэг noindex?

A

79

alvise

24 февраля 2018, 18:01

#1

dmitriy_xom:
почему гугл индексирует страницу, если стоит тэг noindex?

"Внимание! Поисковый робот не обнаружит атрибут noindex, если страница заблокирована в файле robots.txt. Такая страница может быть представлена в результатах поиска (например, если на нее есть ссылка на другой странице)." Справка Гугла.

Потому что на тэг noindex Гуглу наплевать часто. Про пагинацию тут https://support.google.com/webmasters/answer/1663744?hl=ru

DX

60

dmitriy_xom

25 февраля 2018, 09:44

#2

просто по мимо тэга noindex я еще добавил canonical на 1 стр, и все равно результат тот же.

225

D.iK.iJ

25 февраля 2018, 16:27

#3

Гугл может не перейдет ПО ЭТОЙ ссылке, но может найти страницу в любом другом месте. Даже на другом сайте. И проиндексировать.

Что-то не помню особо надежных вариантов кроме robots.txt

Адаптивный дизайн в 2 строчки ( https://dikij.com/wm/adaptaciya-saytov.php ). + Принимаю заказы любой сложности ( https://searchengines.guru/ru/forum/926323 ). 💎 Еще я делаю классные кулоны с опалами ( https://mosaicopal.ru/ ).

AR

78

And-rey

26 февраля 2018, 09:17

#4

dmitriy_xom:
просто по мимо тэга noindex я еще добавил canonical на 1 стр, и все равно результат тот же.

Нельзя смешивать тэг canonical вместе с noindex, это неверная настройка и гугл просто игнорирует все эти указания.

И потом, follow или noffolow после команды noindex... с этого года не имеет значения и важности. Гуглу самое главное что уже стоит первой запрещающая директрива noindex в мета-тэге.

DX

60

dmitriy_xom

26 февраля 2018, 10:33

#5

And-rey:
Нельзя смешивать тэг canonical вместе с noindex, это неверная настройка и гугл просто игнорирует все эти указания.
И потом, follow или noffolow после команды noindex... с этого года не имеет значения и важности. Гуглу самое главное что уже стоит первой запрещающая директрива noindex в мета-тэге.

Вообщем понятно, проще закрыть robots.txt и не морочить голову. Просто думал, может вес с пагинаций будет переходить на главную, через canonical.

C

45

chebj

26 февраля 2018, 10:43

#6

Из справки google/

Инструкции robots.txt носят рекомендательный характер

Настройки файла robots.txt являются указаниями, а не прямыми командами.

настройте rel=prev и rel=next, для указания страниц пагинации

И как показывает практика, иногда в поиск выходят страницы и даже сайты закрытые в роботс

DX

60

dmitriy_xom

26 февраля 2018, 11:08

#7

chebj:

И как показывает практика, иногда в поиск выходят страницы и даже сайты закрытые в роботс

еще такого не встречал.

225

D.iK.iJ

26 февраля 2018, 12:02

#8

dmitriy_xom:
еще такого не встречал.

Первое, что нагуглил. Бывает, допустим, когда какую-то страницу внезапно закрыли в роботс, а ссылки на нее есть.

754

богоносец

26 февраля 2018, 12:21

#9

dmitriy_xom:
еще такого не встречал.

https://www.google.ru/search?q=liveinternet+поисковых+систем

Disallow: /stat/

AR

78

And-rey

26 февраля 2018, 16:56

#10

dmitriy_xom, смотрите какая у вас ситуация... Изначально в роботс.тхт у вас было закрыто командой Disallow: /*offset=* и *&offset= (это и сейчас есть). Но сама страница отдаёт гуглу команду 200 ОК - доступно, она (точнее сам урл) есть "физически". Но тут же он обнаруживает что в роботсе не надо её содержимое помещать в индекс поисковых баз. Об этом и пишет что "Информация не доступна..." Раньше вообще писалось что ",..закрыто в файле роботс"

Сейчас вы поставили тэг "noindex", но гуглу в приоритете команда из роботс.тхт вообще ничего там не проверять и не смотреть. Поэтому он и не видит вашу новую настройку в коде. Нужно убрать Disallow: /*offset=*, чтобы получить доступ к этим страницам и там в коде боту увидеть noindex...

Вот тогда они все и полезут из поисковой выдачи прочь.

Какая у вас CMS? Что-то я так и не понял по исходному коду. Там надо внимательно проверить, что еще с этим *offset= генерируется, чтобы не попало в индекс.

1

Дзен реализовал для авторов возможность вывода денег через СПБ

Переиграть и победить: как анализировать конкурентов для продвижения сайта