Маршрут для роботов [robots, sitemap, нужна помощь]

К2
На сайте с 19.01.2016
Offline
1
762

Добрый день!

Хочу поговорить о установке очередности индексирования страниц роботами.

Существует сайт, у него есть раздел с почти что 200.000 страницами каталога - на каждой по 20 ссылок на информацию о предприятиях.

Вебмастер указывает, что роботы валят сайт, начиная индексировать эту информацию, и просит настроить маршрут.

Можно ли настроить очередность индексации? Какие есть варианты?

Действительно ли проблема падения сайта связана с этим?

Что я сделал в robots.txt:

1)закрыл нежелательную директорию

2)добавил ссылку на правильный sitemap.

С сайтмапом странная ситуация - есть sitemap, в котором вместо УРЛ показаны локальные IP, и есть sitemap000, в котором все правильно. Можно ли вручную заменить их в данной ситуации?

И даже в правильном варианте нет приоритетов страниц.

Здесь речь шла о приоритетах страниц, и основной месседж - они бесполезны и работают только относительно друг друга.

Помогут ли они?

Спасибо заранее! :idea:

W
На сайте с 13.09.2013
Offline
122
#1

http://habrahabr.ru/company/altweb/blog/239153/ - старенькая, но полезная статья о вашем вопросе.

Самые полезные вещи - генерирующиеся ссылки для ботов, заголовки If-Modified-Since и нормальный сайтмэп с приоритетами страниц. Ну и ненужных ботов - Бинг, Байду и остальных можете просто через роботс отсечь

К2
На сайте с 19.01.2016
Offline
1
#2

Спасибо!

Статья написана сложным языком, и нет примеров, но я разбираюсь. И конечно, отрезал все лишние боты.

А с этим вопросом поможете?

С сайтмапом странная ситуация - есть sitemap, в котором вместо УРЛ показаны локальные IP, и есть sitemap000, в котором все правильно. Можно ли вручную заменить их в данной ситуации?

Можно ли без риска заменить текущий СМ на СМ000, переименовав их и удалить лишний?

W
На сайте с 13.09.2013
Offline
122
#3
Константин_22:
Спасибо!
Статья написана сложным языком, и нет примеров, но я разбираюсь. И конечно, отрезал все лишние боты.

А с этим вопросом поможете?


Можно ли без риска заменить текущий СМ на СМ000, переименовав их и удалить лишний?

Не знаю, нужно админку смотреть. Такое ощущение, что эти сайтмэпы генерируются, а генерируемый всегда лучше статичного. А что мешает в роботсе СМ000 прописать и в вебмастера добавить?

К2
На сайте с 19.01.2016
Offline
1
#4

Добавил в вебмастера сразу же, но он определяет как некорректное название файла.

Так и не разобрался, пока что робот яндекса все так же валит сайт

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий