Да нет, речи об определении позиции пока не идет. Я просто предполагая, что позицию в серпе помимо текстового ранжирования определяет и ссылочное ранжирование, хочу разобраться именно с релевантностью текста, т.к. этим фактором мы управлять можем в большей степени и на практике будет полезнее...
О моделировании черного ящика тоже речи не идет - тут нужны глубокие знания по системному анализу и математике
______________
Понял в чем суть игры с весом слова :-) Подбирал-подбирал, получилось, что степень =0,56 , а не 0,38. Точность (проверял на небольшой выборке) +/- 500 единиц веса... Будем дальше работать... 😮
ХренРедькиНеСлаще, веса слова - величина постоянная (от апдейта к апдейту незначительно меняющаяся), разве не так? Да и мягкость обычно = 6... В любом случае все это можно найти через строку запроса Яндекса...
А вот где в формуле кворума степень или логарифм - простым перебором сложно найти...
На счет коэффициентов понятно, но как быть с подсчетом количества релевантных пассажей. Просто считать количество повторений ключевой фразы в тексте (или ее части, прошедшей кворум) или как-то иначе? Явно тут подсчет по другому ведется, нежели при однословном запросе...