Для индексации свежая дата стр НЕ хорошо?

MaxB
На сайте с 29.04.2003
Offline
110
989

Уважаемые дамы и господа, есть такой вопрос.

Имеем крупный сайт с динамическим контентом. Время обновления каждой страницы выдается скриптом и является временем на момент запроса. В Яндексе проиндексировано более 3000 страниц с сайта и еще уйма не проиндексирована. И глядя на статистику роботов Яндекса убеждаюсь, что свежая дата документа для большоего контента НЕ есть хорошо. Робот отвлекается на уже проиндексированные страницы, т.к. видит, что они уже устарели и не индексирует другие, еще не попавшие в индекс.

Посоветуйте пожалуйста, как быть в таком случае.

Я уже наметил вариант, в котором будет проставляться реальная дата изменения контента именно данного документа (хотя это достаточно трудоемко).

Если страница не изменялась с момента последней индексации, робот ее трогать не будет? (У меня за обход Яндекс берет ровно 500стр) Будет ли эта стр включена в список этих 500ста?

[Удален]
#1

Наверное лучше проставлять дату с периодом переиндексации. То есть если допустим бот переиндексирует в среднем раз в неделю, то нужно устанавливать дату с этим шагом.

MaxB
На сайте с 29.04.2003
Offline
110
#2

Ну и какой резон от этого?

Я ведь хочу, чтобы робот видел, что некоторые страницы не изменяли контент со времени прошлой индексации. А так что изменится -ничего.

C
На сайте с 19.09.2001
Offline
120
#3

Если просто выдавлять реальную дату изменения документа вместо текущей, робот все равно будет брать документ.

Реально существует два варианта:

1. Ждать, когда робот доберется до новых страниц. Это произойдет если старые страницы не меняются долгое время.

2. Эмулировать статику с выдачей всех необходимых HTTP заголовков.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
ER
На сайте с 19.11.2002
Offline
107
#4
Если просто выдавлять реальную дату изменения документа вместо текущей, робот все равно будет брать документ.

Разве? Кто-то из Яндекса говорил, кажется, о том, что уже проиндексированные документы со старой датой, в число забираемых 500 попадать не будут.

A
На сайте с 10.03.2003
Offline
23
#5

Проставлять нужную дату для каждой отдельной страницы дело трудоемкое и не всегда благодарное, т.к. (по моим наблюдениям) Яндекс не совсем верит датам обновления документа, а верней совсем не верит.

При повторной индексации он сравнивет с прошлым запомнином документом и из этой информации и исходит как часто переиндексировать данную пагу.

А даты, которые выдает сервер он показывает при выдаче и все.

Т.е. через пару месяцев он сам поймет, что обновляется, а что нет.

C
На сайте с 19.09.2001
Offline
120
#6
Разве? Кто-то из Яндекса говорил, кажется, о том, что уже проиндексированные документы со старой датой, в число забираемых 500 попадать не будут.

Не будут, если кроме даты обрабатывать заголовок запроса If-Modified-Since, если же просто выдавать дату и "200 Ок", то робот все равно будет забирать документы.

А даты, которые выдает сервер он показывает при выдаче и все.

Не всегда.

MaxB
На сайте с 29.04.2003
Offline
110
#7
Как писал Cherny

Не будут, если кроме даты обрабатывать заголовок запроса If-Modified-Since, если же просто выдавать дату и "200 Ок", то робот все равно будет забирать документы.

Не всегда.

А можно подробнее как формировать If-Modified-Since 😕

C
На сайте с 19.09.2001
Offline
120
#8
А можно подробнее как формировать If-Modified-Since

Не формировать, а обрабатывать.

Как неоднократно замечал многоуважаемый Aik, надо читать rfc, в данном случае rfc-2616.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий