Изучать вопрос и пытаться понять, на какие из факторов можно воздействовать и как.
6-й задать не получается, а остальные - можно.
Есть адекватная методика, позволяющая это установить?
Я бы даже сказал сосем не по плотности. О плотности было бы уместно говорить, если фунция нормирования TF*IDF представляла бы собой DL - длину документа в словах. Тогда бы мы получали TF/DL - эту самую плотность (TF здесь - это частотность термина, или, другими словами, количество его употреблений). Однако реальные функции нормировки слегка посложней, и могут вообще не содержать DL, либо нормированная TF не будет иметь линейной зависимости от плотности TF/DL даже если функция нормирования и зависит от DL.
А что мешает их через месяц снова проверить?
Да открываются они, только выдача там та же, что и в основном поиске, хоть и с 6-го фронт-сервера.
Хм... Ну, про подобный знаменатель достоверно можно говорить в разрезе только одной ПС - Яндекса, да и то где-то за период с конца 2006-го по конец 2007-го года, когда этот факт можно было достоверно проверить благодаря методике Миныча.
В каких? :)
По-моему - понятия оптимальной плотности не существует. Поисковики другими показателями оперируют.
Не предполагал, а констатировал. Почувствуйте разницу. ;)
И какова оптимальная плотность? :)