Включение Last-Modified. Полный крэш

D
На сайте с 21.07.2004
Offline
2
dsh
983

Жил старый добрый сервер. Под 100K страниц. Посмотрели - половина только проиндексирована. Last-Modified - не отдается.

Отдали. Причем честно. Если статья выложена в 1998 г., так она и выдается как в том году. Единственно хоумы, основной и разделов генерят автоматом текущую дату. Что, впрочем недалеко от истины.

Результат впечатляет:

Все. больше не было.

2004-08-03 Yandex/1.01.001 (compatible; Win16; I) 56

2004-07-31 Yandex/1.01.001 (compatible; Win16; I) 953

2004-07-22 Включена выдача Last-modified

2004-07-18 Yandex/1.01.001 (compatible; Win16; I) 1062

2004-07-07 Yandex/1.01.001 (compatible; Win16; I) 383

2004-06-26 Yandex/1.01.001 (compatible; Win16; I) 1065

2004-06-21 Yandex/1.01.001 (compatible; Win16; I) 3575

2004-06-17 Yandex/1.01.001 (compatible; Win16; I) 4421

2004-06-16 Yandex/1.01.001 (compatible; Win16; I) 3237

2004-06-15 Yandex/1.01.001 (compatible; Win16; I) 409

2004-06-14 Yandex/1.01.001 (compatible; Win16; I) 3862

Ну и как жить?

Alex Kirillin
На сайте с 11.01.2004
Offline
105
#1

Боже, а зачем 100K страниц-то нужно? Никак не пойму я этого, почему от индексации всякие сортировки, версии для печати итп не закрыть в роботс. Ну не набрать ведь столько информационных страниц даже года за 4 новостному порталу. Даже если по 40 новостей в день и по 10 статей.

А жить можно отлично, только помимо обработки Last-Modified надо обрабатывать и If-Modified-Since, если на сайте больше 500 страниц - для хорошей индексации это прям таки необходимо.

Александр Кириллин «Аладна» - Студия дизайна / Разработка сайтов (http://www.aladna.ru/) «Аладна» - Поисковая оптимизация / Продвижение сайтов (http://seo.aladna.ru/)
[Удален]
#2

А вообще, причем тут last modified ? Во-первых, он всем параллелен. Во-вторых, ну хреново яндекс в августе работал :(

@
На сайте с 09.12.2003
Offline
134
#3
Как писал Miha Kuzmin
А вообще, причем тут last modified ? Во-первых, он всем параллелен.

Если страницы - статика, то может и не причем, а если динамика, то как же без него обойтись то? :)

[Удален]
#4

А Яндексу пофиг, что вы в этом заголовке напишете. Изменилась страница, или нет - он оценивает на основе полученного содержания. Так что надо обрабатывать if-modified-since, тогда можно заставить робота взять больше.

@
На сайте с 09.12.2003
Offline
134
#5
Как писал Interitus
А Яндексу пофиг, что вы в этом заголовке напишете.

Ну ведь в if-modified-since дата какая-то посылается? Хотите сказать, что для Яндекса это дата последней индексации документа, в независимости от того, какую дату вернул документ? Возможно это и так. А вот с тем, что можно заставить робота взять больше несоглашусь. Он все равно больше определенного лимита не возьмет. Скорее его можно заставить взять то что нужно :)

[Удален]
#6

@uthor, ты не понял. Яндексовский бот не учитывает в лимите немодифицированные страницы. Так что если правильно обрабатывать if-modified-since, то можно скармливать только изменившиеся страницы.

p.s. А last-modified - ну совершенно ему пофиг :)

@
На сайте с 09.12.2003
Offline
134
#7
Как писал Miha Kuzmin
@uthor, ты не понял. Яндексовский бот не учитывает в лимите немодифицированные страницы. Так что если правильно обрабатывать if-modified-since, то можно скармливать только изменившиеся страницы.

p.s. А last-modified - ну совершенно ему пофиг :)

С last-modified я все сразу понял. А по поводу скармливания... Допустим у меня на сайте 10000 страниц. В результате обработки if-modified-since 7000 из них отдают 304 Not Modified. Соответсвенно 3000 отдают 200 Ок. Обрабатывая if-modified-since я только смогу отправить робота на нужные страницы, но все 3000 он за раз все равно не возьмет.Поэтому я и говорю, что можно управлять индексацией, а кол-во страниц все равно не увеличить.

Одним словом, говорим мы об одном и том же :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий