Серч консоль не видит страницы в sitemap.xml

12
S1
На сайте с 02.09.2021
Offline
1
443
Всем привет, помогите плиз разобраться, уже не знаю куда копать. Многие важные страницы не индексируются и серч консоль пишет, что их нету в сайтмапе. Проект большой, на данный момент 12 карт, в каждой по 25к урлов. Поиском по карте эти страницы находит, они там действительно есть. Пробовали страницы категорий закидывать в первые карты, но ничего не помогло. Прошу поделиться советом, спасибо! 
jpg 987987987987.jpg
jpg 89798798.jpg
Виктор Петров
На сайте с 05.01.2020
Offline
240
#1
Не надо слепо доверять тому, что пишет SC. Это один из их инструментов, функциональность которого периодически отваливается - из экономии ресурсов, или в процессе переделок, или просто потому.
Сайтец у вас, судя по всему, не самый маленький. Смотрите, что у вас там с лимитом обхода, и вообще, есть ли проблемы со сканированием. Видал случаи, когда до половины сайтов (магазины) гуглоботу не были доступны из-за криво настроенных редиректов, например. Бота просто отправляло по кольцевому редиректу, и он ни черта не мог просканировать.
Ну, и логи гляньте в сопоставлении с выгрузкой данных из той же сёрч консоли. Логи врать не будут.
Nixenz
На сайте с 24.08.2021
Offline
25
#2
Если будет проблема по итогу с тем, чтобы бот смог добраться, то делайте xml карту, хлебные крошки, и обычную карту сайта, с листингом всех страниц сайта.
Семантическое Ядро: https://semanticheskoe-yadro.ru
D
На сайте с 29.10.2018
Offline
59
#3

А, что значит sitemap.xml?page=12 ?

На сколько я знаю .xml это единый файл, такую пагинацию впервые вижу.

G6
На сайте с 12.07.2007
Offline
184
#4
Denechka #:

А, что значит sitemap.xml?page=12 ?

На сколько я знаю .xml это единый файл, такую пагинацию впервые вижу.

Не единый, в смысле может содержать индексную страницу с перечислением (ссылками) на остальные карты, все конечно правильно оформленное. По другому, как вы себе представляете карту сайта с сотнями тысяч ссылок, категорий, форматов и тд?

Очистите трафик сайта от ботов и накруток ПФ https://antibot.worldwebinfo.ru
Виктор Петров
На сайте с 05.01.2020
Offline
240
#5
garry69 #:
По другому, как вы себе представляете карту сайта с сотнями тысяч ссылок, категорий, форматов и тд?

ссылки на другие карты - да, но пагинация?

SeVlad
На сайте с 03.11.2008
Offline
1609
#6
Антон :
на данный момент 12 карт

А индексный случаем не пропал?

Ида " ?page=12"  явно не правильно. Нужны статические имена. Например "sitemap-12.xml"

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
D
На сайте с 29.10.2018
Offline
59
#7
garry69 #:

Не единый, в смысле может содержать индексную страницу с перечислением (ссылками) на остальные карты, все конечно правильно оформленное. По другому, как вы себе представляете карту сайта с сотнями тысяч ссылок, категорий, форматов и тд?

Изучите структуру файлов .xml.

На сколько я знаю там ни каких get-запросов не может быть в принципе (а пагинация - это не что иное как get-запрос).

ТС надо сделать статикой, без всяких фокусов.

1 индексный файл со ссылками на другие СТАТИЧЕСКИЕ файлы (по 50000, помоему хавает). И не обязательно .xml, .txt тоже хавает великолепно. Мне нравится - порциями по 50000 строк урлов выбрал из БД с новой строчки - и вперёд, названия тоже роли не играют (можно, например 12.txt назвать).

И потом можно наблюдать по логу, когда гуглобот их съест. Понравится ему - через какое-то время в индексе.

W1
На сайте с 22.01.2021
Offline
306
#8
SeVlad #:
" ?page=12"  явно не правильно

Какая для ПС разница? Есть URL сайтмапа, выдаётся по этому URL валидный документ - этого достаточно.

И да, это у них Друпал такое генерирует:



Мой форум - https://webinfo.guru –Там я всегда на связи
S1
На сайте с 02.09.2021
Offline
1
#9
Да, все верно, это генерирует сам друпал такую карту. Так же не вижу никакой проблемы в этом
SeVlad
На сайте с 03.11.2008
Offline
1609
#10
webinfo #:
Какая для ПС разница? Есть URL сайтмапа, выдаётся по этому URL валидный документ - этого достаточно.
Хм.. Возможно ты и прав. В стандарте сайтмапа я не нашел требований к именованию файла, кроме соответствия RFC-3986/7. Однако засада может быть в индексаторах сайтма гуглояндексов. Но тут я не готов ничего утверждать - надо будет почитать позжее.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий