Посмотрите в подписи :)
Это не данные, это фикция :)
Это предлагал не я, а слушатель семинара ;)
Сие есть разные вещи.
Разумеется. Чем больше выборка, тем меньше погрешность :)
Только построение модели и проверки ее в рамках тестовых коллекций.
Если есть альтернатива, с удовольствием выслушаю :)
А почему бы и не показать? :)
Как минимум, одним из аргументов функции нормировки он остался.
Гугл, кстати, тоже не по длине нормирует ;)
Чак.
10 ископаемых
В лучшем случае эти термины не будут учтены в ранжировании.
В худшем - получите санкции за поисковый спам.
Длина документа значение в текстовом ранжировании не имеет :)
Речь о том, что ПС не нормируют по длине документа.
В знаменателе участвует фукнция от самого частотного термина.
Из платных - яззл.
Из бесплатных - http://miratools.ru/text/