Sitemaps vs куча страниц - Всё ли прописывать

Skom
На сайте с 02.12.2006
Offline
165
1779

Исходные данные:

Сайт с где-то полулярдом страниц. Ну, скажем так, некая онлайн библиотека всякой технической ереси. Причем не кал, а действительно СДЛ, но очень низкочастотный.

Количество документов постоянно растёт.

Документы многостраничные и разбиты урлами на page=2 .. page=N в зависимости от количества страниц.

Первая страница не имеет своего 'page' идентификатора, но имеет, как и все остальные страницы одного документа, ссылки на остальные страницы того же документа. Чтобы пользователь мог перемещаться между страницами.

В данный момент, в сайтмэпе указаны только первые страницы каждого документа в надежде на то, что Гугл поймет и просканирует остальные страницы того же документа, не указанные в сайтмэпе, но имеющие ссылки с первой страницы.

В данный момент, анализ логов показывает, что вхождение гуглобота в 90% случаев идёт на первую страницу документа. И только в 5% на остальные страницы. Ещё 5% на внутреннюю навигацию.

Изначально кажется, что надо указать все, но имея многолетний опыт засовывания в Гугл тяжёлых сайтов, понимаю, что можно убить сайт, скармливая боту тоннами контент, нужный только ограниченному кругу людей.

Собственно вопрос - имеет ли смысл указывать сайтмэпе все страницы документа?

Вернее не так. Не является ли сайтмэп, в данном случае, помехой в принципе?

Т.е. воспринимает ли гугл страницы, не указанные в сайтмэпе, как полноценные страницы и вообще, воспринимает ли их?

Cras amet qui numquam amavit quique amavit cras amet
E
На сайте с 21.09.2009
Offline
283
#1

Почитайте про rel="next" rel="prev" это метатеги указания для бота что есть пагинация. Как вариант, можно указать в консоли роботу что параметр пайдж в урле, это разбиение на страницы.

Skom
На сайте с 02.12.2006
Offline
165
#2

Про rel почитаю. Спасибо.

В вмт пэйдж очень коварная и непонятная штука.

То ли она режет уже имеющийся документ на части(при наличии полной версии документа на отдельной странице), то ли работает так, как хотелось бы. Типа, указал первую страницу, а остальные суть есть паджинация...

E
На сайте с 21.09.2009
Offline
283
#3

У пэйдж резателя есть примеры где робот их нашел. Посмотрите какие именно, и ставьте на нужных. Почитайте про каноникал в хелпе гугла. В случае порезки на части страницы статьи(для пагинации категорий другое), и наличии полной версии страницы, надо его ставить.

Lor
На сайте с 28.05.2004
Offline
352
Lor
#4
Skom:
Документы многостраничные и разбиты урлами на page ...
...
В данный момент, в сайтмэпе указаны только первые страницы каждого документа ...

Так и оставьте если это один многостраничный документ.

Я еще обычно вывожу:

<META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW"> if current_page_number > 3..5

Но это, зависит от того как у вас сделана внутренняя перелинковка. В вашем случае подойдет.

Йопез - форум без модераторов. https://yopez.com

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий