Найти "идеальную плотность" на "идеальной длине документа".
Вы говорите о фиксированном IDF и вариации TF в случае упрощения (условного фиксирования) коэффициентов в знаменателе и сохранения соотношения ni и DocLenght? Типа этого[ATTACH]53098[/ATTACH]?
Система, видимо, есть. Только, видимо, ее непросто увидеть.
Если devzev прав (на счет тфидф ), то надо иметь в виду, что к одинаковым (близким по направлению) результатам может привести как воздействие, например, на ni, так и, например, на DocLenght, среди прочих равных.
10*[logX]-1*n!:2cents:
[ATTACH]52974[/ATTACH]
И сильно влияет?
Это - не для коллекции Каширина.
t_o_x_a, нет же - Роберт Шекли: "Цивилизация статуса".
Иногда это цена 1 (одной) ссылки.
Да. Но "доолго" - понятие относительное. ИМХО.