Ужасающий коктейль из фактов, слухов и домыслов :)
Рулит не количество, а качество
Типа несправедливо? :) Зато на них есть ссылки с такой аббревиатурой
Полагаю, под "линками" Расковалов подразумевал анкоры входящих ссылок
Угу. Осталось только установить Я-метрику на каждую страницу индекса, и смело можно будет ранжировать :)
Положительная обратная связь. Этого стараются сторониться, ибо приводит к потере устойчивости системы...
А разве у него аббревиатура не ЦСП? ;)
Если фактор малозначимый, то его значения могут быть какие угодно у сайтов в топе ;)
Предпочитал... :)
Будете добавлять в неделю по ключевому словечку в контент? :)
Просто. Никаких пейджранков. Взять, к примеру несколько дискретных градаций "хорошести" ссылки.
Ну, может быть признак, что-то типа взвешенный tf по анкор-файлу.
Кстати, то, что один фактор (тот, которые "feature" по Сегаловичу) может в куче параметров модели сидеть - хреновый момент. В итоге зависимость результата от него может получиться ни фига не монотонная. К примеру, возьмем tf. Может, получиться, что увеличивая его значения, мы на определенных интервалах можем ухудшать результат (привет портянкам)! Причем, интервалы эти кусочно-постоянные в общем случае будут зависеть от других факторов (если в параметрах сидят произведения разных факторов). То есть tf, допустим в 10, для одного документа будет хорошим результатом, а для другого - плохим. Вот где основная засада-то...
Разработчик, насколько я понял, сейчас думал в первую очередь о том, как без технических косяков запрограммировать и выложить новую формулу. Менялись не спам-фильтры, а обучающий алгоритм.