Как индексировать миллионы страниц?

12
A3
На сайте с 04.12.2024
Offline
0
1125

Добрый день! Обращаюсь за советом (не нашел ответов в анналах интернета) к лучшим сео-умам.

Планируем с коллегами запустить на сайте справочник, после чего на сайте появятся миллионы новых страниц. Все новые страницы разбиваем на файлы для sitemap, соответственно таких файлов будут сотни. Выбираем между двумя подходами:

1) с самого начала добавлять в sitemap файл за файлом и сообщать об этих файлах поисковикам, а дальше ждать того, как поисковики обойдут урлы из данного файла, после этого добавлять следующий файл, сообщать об этом новом файле поисковикам и т.д., пока не пройдем все файлы со всеми урлами;

2) сразу добавить все файлы со всеми урлами в sitemap,  добавить все файлы в поисковики.

Есть ли какая-то разница между этими подходами? Что эффективнее: добавлять поочередно или сразу добавить все файлы? Спасибо за ответ!


big boy
На сайте с 18.11.2006
Offline
356
#1
  1. Краулинговый бюджет ограничен для каждого сайта. Чем сайт старше, крупней, популярней, трастовей, чем там больше трафика - бюджет будет больше, соответсвенно и робот будет за раз проходить и индексировать больше страниц. Поэтому новые сайты могут медленно заходить в индекс.
  2. На крупных сайтах есть проблема не только в первичной индексации. Многие забывают про ПЕРЕиндексацию при внесении изменений. Так вот переиндексация занимает в разы больше времени, чем первичная индексация.

Делал крупные сайты по нескольку лямов страниц и натыкался на эти грабли. Риск тут в разы больше, чем на средних/мелких сайтах. Чуть какой косяк будет обнаружен, исправите вы его быстро, а вот в кэше поисковиков старая версия будет висеть месяцами. А в зависимости от тяжести "нарушения" можно и фильтр словить.

Поэтому мой вам совет - добавлять страницы на сайт пачками. Или открывать их для индексации пачками, но лучше первый вариант. Что вы добавляете в сайтмап должно коррелироваться с тем, что есть на сайте. Если на сайте будет лям страниц, а в сайтмапе 100, боты будут находить страницы по ссылкам с других страниц. Сайтпам - это лишь карта для удобства. Но страницы могут в индекс залетать и минуя эту карту.

Почему стоит добавлять страницы постепенно:

  • Во-первых, так проще контролировать индексацию и постепенно наращивать объемы. Поисковики любят движ, когда сайт растёт, контент добавляется.
  • Во-вторых, в случае косяков, лучше их заметить и исправить на ранних стадиях, когда страниц не много, чтобы новые попадали в индекс уже исправленные, а старые могли быстрей переиндексироваться.

Минусы этого подхода: трафик может медленней расти. Но это лишь при условии уверенности, что всё правильно и вылизано на 146%. А это чаще не так. Всегда есть неучтённые детали на новых сайтах.

Поверьте, цена ошибки при добавлении всех страниц сразу гораздо выше, чем низкая скорость роста при постепенном добавлении.

По сабжу: google indexing api и indexnow для яндекса и бинга. Либо сервисы индексации, но с крупными объемами может быть неоправданно дорого.

✔ Как я генерирую статьи через ИИ, которые приносят трафик - https://webmasta.ru/blog/16-vkalyvayut-roboty-ne-chelovek-stati-s-pomoschyu-ii-kotorye-prinosyat-trafik
big boy
На сайте с 18.11.2006
Offline
356
#2

И еще важнецкий момент.

Для чего делается справочник? Для пользователей или для поисковиков и для попытки нарастить траф?

Если сайт изначально крупный, популярный, есть ядро постоянных посетителей, которые реально пользуются сайтом и справочник - это то, что они хотят и чем будут пользоваться, то можно добавлять всё сразу и не париться сильно, поскольку для подобных вещей поисковики более снисходительны и прощают популярным порталам многие ошибки.

Есть такая тенденция: чем сайт крупней/популярней - тем он меньше обращает внимание на SEO и сосредотачивается на пользователях, удобстве и полезности.

Если сайт мелкий/новый, то SEO для него в разы важней. Ему прощать то, что простили крупному сайту не будут.

A3
На сайте с 04.12.2024
Offline
0
#3
big boy #:

И еще важнецкий момент.

Для чего делается справочник? Для пользователей или для поисковиков и для попытки нарастить траф?

Если сайт изначально крупный, популярный, есть ядро постоянных посетителей, которые реально пользуются сайтом и справочник - это то, что они хотят и чем будут пользоваться, то можно добавлять всё сразу и не париться сильно, поскольку для подобных вещей поисковики более снисходительны и прощают популярным порталам многие ошибки.

Есть такая тенденция: чем сайт крупней/популярней - тем он меньше обращает внимание на SEO и сосредотачивается на пользователях, удобстве и полезности.

Если сайт мелкий/новый, то SEO для него в разы важней. Ему прощать то, что простили крупному сайту не будут.

Спасибо за столь обстоятельный ответ! Сайт пока небольшой, не приходится рассчитывать на то, что те немногие пользователи, которые есть - будут на первых пора активно пользоваться этим справочником.

Vladimir SEO
На сайте с 19.10.2011
Offline
2051
#4
Asket360 :
Планируем с коллегами запустить на сайте справочник, после чего на сайте появятся миллионы новых страниц.

а он точно там нужен? вы сможете сделать справочник ценным по контенту, активности и лучше чем у конкурентов? если нет - то не стоит запускать

Asket360 :

1) с самого начала добавлять в sitemap файл за файлом и сообщать об этих файлах поисковикам, а дальше ждать того, как поисковики обойдут урлы из данного файла, после этого добавлять следующий файл, сообщать об этом новом файле поисковикам и т.д., пока не пройдем все файлы со всеми урлами;

2) сразу добавить все файлы со всеми урлами в sitemap,  добавить все файлы в поисковики.

Есть ли какая-то разница между этими подходами? Что эффективнее: добавлять поочередно или сразу добавить все файлы? Спасибо за ответ!

пс проходят не по урлам из карт а по ссылкам на сайте - это главное условие, если у вас хорошая структура, шикарная скорость, контент- огонь - то сразу все в индекс и вперед, если нет - то никакие карты и способы не помогут

лично знаком с такой ситуацией


Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/
mbertoni
На сайте с 25.07.2017
Offline
59
#5
Реальные тесты покажут что произойдет. Но известно, если на сайте каждый день добавляется страничка с информацией и по свистку зовется робот, то спустя пару таких дней он будет залетать как дети в школу самостоятельно. 
A3
На сайте с 04.12.2024
Offline
0
#6
Vladimir SEO #:

а он точно там нужен? вы сможете сделать справочник ценным по контенту, активности и лучше чем у конкурентов? если нет - то не стоит запускать

пс проходят не по урлам из карт а по ссылкам на сайте - это главное условие, если у вас хорошая структура, шикарная скорость, контент- огонь - то сразу все в индекс и вперед, если нет - то никакие карты и способы не помогут

лично знаком с такой ситуацией


спасибо за ответ! рассчитываем на то, что контент будет ценным за счет того, что на страницах будет ин-фа, которая почти у всех конкурентов доступна только в платной версии.

Vladimir SEO
На сайте с 19.10.2011
Offline
2051
#7
Asket360 #:

спасибо за ответ! рассчитываем на то, что контент будет ценным за счет того, что на страницах будет ин-фа, которая почти у всех конкурентов доступна только в платной версии.

если бесплатная инфа которой ни у кого нету и у этой инфы есть спрос тогда при грамотной структуре ( что бы не было 5-6-7 уровней вложенности) - все будет тип топ. Но если это просто копия проиндексированного контента = выстрел в ногу
Artisan
На сайте с 04.03.2005
Offline
375
#8
Asket360 :
Планируем с коллегами запустить на сайте справочник, после чего на сайте появятся миллионы новых страниц.
Asket360 #:
Сайт пока небольшой, не приходится рассчитывать на то, что те немногие пользователи, которые есть - будут на первых пора активно пользоваться этим справочником.
Asket360 #:
рассчитываем на то, что контент будет ценным за счет того, что на страницах будет ин-фа, которая почти у всех конкурентов доступна только в платной версии.

Вашу информацию разберут уважаемые сайты,

а Ваш сайт накажут за доброту, возможно навсегда.

Vladimir SEO #:
Но если это просто копия проиндексированного контента = выстрел в ногу
Контент с мелкого сайта быстро станет копией,

потому что этот контент разберут другие сайты.

Если сайт пока мелкий, то надо не выкладывать

полезную информацию, а делать сайт уважаемым.

Если пошлёте адрес Вашего сайта в личные

сообщения, то можно подумать на эту тему.

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
big boy
На сайте с 18.11.2006
Offline
356
#9
Artisan #:
Если сайт пока мелкий, то надо не выкладывать

полезную информацию, а делать сайт уважаемым.

Сами-то поняли чего написали? Пользы давать не надо, но уважение зарабатывайте ))) Бить посетителей и по понятиям им раскладывать масть? ))) Или как?

Artisan #:
Вашу информацию разберут уважаемые сайты,

а Ваш сайт накажут за доброту, возможно навсегда.

Далеко не факт. Могут да, а могут и нет.

Коммент ради коммента. Какие-то бабайки рассказываете, которые к реальному положению вещей могут не иметь отношения. Можно было с таким же успехом еще написать, что завтра ядеркой всех накроет и можно ничего не делать.

NoMoreContent
На сайте с 14.05.2023
Offline
30
#10

Ну хоть кто-то выложил скриншот не детского уровня.

Моё почтение (с).

P.S. Совет ТСу - прячьте карты сайта, делайте неочевидные URL, поиск и навигацию.
Иначе будут парсить 24/7/365.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий