Еще раз о last-modified

I
На сайте с 30.09.2003
Offline
8
877

Господа, понимаю, что вопрос о дате обсуждался много раз, но я опять забрался в тупик.

Проблемма - Яндекс не индексирует на моем сайте более чем 450-470 страниц. Я понимаю, что это его предел за один раз, но очень хотелось бы увеличить общее число проиндексированных страниц хотя бы до размеров Рамблера - 1400-1600.

Одна из причин, высказанная в форуме была следующей:

Langer:

Я грешу на то, что дата у нас генерируется синтетически (практически текущая), отсюда Яндекс заново индексирует уже проиндексированные документы.

ВОПРОС - правильна ли идея Langer? Если "да", то как это обойти?

Кроме того, было отмечено:

А у Вас в принципе вообще дата не выдается. Посмотрите, у вас вообще нет "Last-Modified:"...

Я сделал запрос на сайт -

Как пример запроса центральной страницы www.(сайт в профайле).ru

16:06 по москве вернулся такой ответ на запрос

wget -d www.(сайт в профайле).ru

---request end---

Запрос HTTP послан, ожидание ответа... HTTP/1.1 200 OK

Date: Mon, 13 Oct 2003 12:05:52 GMT

Server: Apache/1.3.26 (Unix) PHP/4.0.1pl2 mod_perl/1.27 rus/PL30.14-alpha

Connection: close

Content-Type: text/html; charset=koi8r

Expires: Thu, 01 Jan 1970 00:00:01 GMT

Last-Modified: Mon, 13 Oct 2003 12:06:12 GMT

Как видим, дата last-modified возвращается.

В чем я не прав с датой? Выручайте. Сам бьюсь уже почти 6 месяцев, но ничего не получается.

S
На сайте с 27.06.2003
Offline
55
#1

На мой взгляд все время "свежая" дата для робота то же самое что и никакой даты last-modified. Робот БУДЕТ забирать документ и если со временем выяснит что изменений нет, то забирать будет все реже. Но вот на это "выяснение" ему может понадобиться много времени.

Лучше выдавать 304 на запрос с заголовком if-modified-since. Такие документы, как я понимаю, НЕ входят в квоту забираемого за раз.

LM
На сайте с 30.11.2001
Offline
71
LiM
#2
Лучше выдавать 304 на запрос с заголовком if-modified-since. Такие документы, как я понимаю, НЕ входят в квоту забираемого за раз.

Правильное понимание... Так можно сильно ускорить работу индексатора.

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
M
На сайте с 19.08.2003
Offline
28
#3

Infors, у меня подобная проблема. Яндекс 2 года назад прекратил добавление новых страниц. Старые не обновляются (Яндексом не обновляются. Мной обновляются). Версия с баном отпадает, потому что во-первых, не за что, во-вторых, через addurl страницы добавляются. Остальные поисковики индексируют нас очень хорошо.

Дата last modified тоже отсутствует, тест, который вы приводите, тоже показал, что Яндекс дату видит. Но я видела в Яндексе полно сайтов тоже с отсутствующей датой последней модификации, с прекрасно проиндексированными обновлениями. Так что, не факт, что это верный след.

Переписка с Яндексом света не пролила. Но я и не очень усердствовала в этом направлении, потому что сайт некоммерческий и результаты в Яндексе для меня вопрос, в основном, морального удовлетворения.

Тем не менее, хотелось бы разобраться. Напишите, если вам удастся решить проблему.

I
На сайте с 30.09.2003
Offline
8
#4
Как писал Seliger
На мой взгляд все время "свежая" дата для робота то же самое что и никакой даты last-modified. Робот БУДЕТ забирать документ и если со временем выяснит что изменений нет, то забирать будет все реже. Но вот на это "выяснение" ему может понадобиться много времени.

Похоже, что именно так все и происходит. Робот забирает только старые - неизмененные документы, а новые просто игнорирует.


Лучше выдавать 304 на запрос с заголовком if-modified-since. Такие документы, как я понимаю, НЕ входят в квоту забираемого за раз.

Не совсем понял, что это такое, но звучит заманчиво :) и надеюсь, что программисту это будет понятно. Если что-то измениться обязательно сообщу.

LM
На сайте с 30.11.2001
Offline
71
LiM
#5
Лучше выдавать 304 на запрос с заголовком if-modified-since. Такие документы, как я понимаю, НЕ входят в квоту забираемого за раз.

Не совсем понял, что это такое, но звучит заманчиво и надеюсь, что программисту это будет понятно. Если что-то измениться обязательно сообщу.

RFC2616 Вам поможет понять все... (Искать лучше в Гугле ;))

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий