@uthor

Рейтинг
134
Регистрация
09.12.2003

И дополнение к п.2. Сразу непросмотрел всю статистику до конца.

То что описано выше происходило утром.

Вечером на этом ресурсе был еще и Апорт. Скушал 1206 страниц. В этоже время гугльбот там тоже что-то добирал. Видимо то, что не взял утром. Так вот гугльбот и бот апорта работали одновременно и похоже нисколько друг-другу не мешали...

Как писал Miha Kuzmin
@uthor, ты не понял. Яндексовский бот не учитывает в лимите немодифицированные страницы. Так что если правильно обрабатывать if-modified-since, то можно скармливать только изменившиеся страницы.

p.s. А last-modified - ну совершенно ему пофиг :)

С last-modified я все сразу понял. А по поводу скармливания... Допустим у меня на сайте 10000 страниц. В результате обработки if-modified-since 7000 из них отдают 304 Not Modified. Соответсвенно 3000 отдают 200 Ок. Обрабатывая if-modified-since я только смогу отправить робота на нужные страницы, но все 3000 он за раз все равно не возьмет.Поэтому я и говорю, что можно управлять индексацией, а кол-во страниц все равно не увеличить.

Одним словом, говорим мы об одном и том же :)

Как писал Interitus
А Яндексу пофиг, что вы в этом заголовке напишете.

Ну ведь в if-modified-since дата какая-то посылается? Хотите сказать, что для Яндекса это дата последней индексации документа, в независимости от того, какую дату вернул документ? Возможно это и так. А вот с тем, что можно заставить робота взять больше несоглашусь. Он все равно больше определенного лимита не возьмет. Скорее его можно заставить взять то что нужно :)

Как писал Miha Kuzmin
А вообще, причем тут last modified ? Во-первых, он всем параллелен.

Если страницы - статика, то может и не причем, а если динамика, то как же без него обойтись то? :)

Artlight, ну что Вы к каталогу то прицепились? Вопрос же не об этом был. Сайтов не внесенных в каталог Яндекса значительно больше чем внесенных, и это не мешает им обмениваться ссылками, добавляться в каталоги и вобще "жить полноценной жизнью" :)

Сразу, можно даже на сайт не ставить.

Как писал Anatoliy_K
Ссылки непрямые, и на страницах они не размещены. Размещен код системы.

Эти кривые ссылки выдают 302 Redirect, так что не факт, что никак не влияет.

В Рамблере такие ограничения однозначно есть. Без проблем берутся в принципе страницы с одной переменной, т.е. со знаком "?" и без "&". А вот за Апортом я такого не замечал. Он берет все и много.

Я думаю что проблема в том, что у вас к УРЛ добавляются сессии. В базу попало много одинаковых страниц, но с разным урлом (отличие в сессии) и из-за этого Вам понизили квоту на индексацию.

Всего: 284