две недели назад, когда ты еще был с нами, ты мне напрямую об этом всё сказал и не только мне.
сначала связь даже какая-то просматривалась и алгоритм работы была даже мысль откорректировать. хорошо, что все-таки решили серьезнее проверить гипотезу..в процессе выяснилось, что это не более чем совпадение.
сомневаюсь, что ты знаешь:) Жень, хоть практический вывод был из этой "связи" сделан правильный, но .. о "связи" вышел сказал.
о связях говорит не буду, потому как ты это придумал и тебе решать говорить об этом в открытуб или нет. возможно, конечно, что-то уже изменилось в твоих мыслях.
НО все-таки скажи, что ты подразумеваешь под tf (не нормированной)? только напрямую :)
в англоязычных статьях описывались эксперименты по выбору нормировки при анкорном ранжировании. логорифмическая функция бесспорно была наиболее релевантна☝
разговор уже отклонился от темы.
думаю, что стоит ознакомиться с векторной моделью, в котрой есть кое-что о многословных запросах(QL>1), в том числе и о распределении весов. только пока сам не сильно понял модель.
wolf, по сабжу мыслей не подкинете?
я сказал вам своё мнение по поводу этого эксперимента. дальше уж смотрите сами.
не поделитесь гипотезой?:)
что это меняет? :)
wolf действительно утверждает, что помимо TFa и IDFa присутсвует еще IDF, НО он же сделал оговорку, что
вы знаете как нормируется? чтобы менять эту величину.
каким образом?
характер - непрерывно возрастающий:) вид функции подобным образом не определить, погрешность большая.
p.s. через любые 3 точки можно провести линию..определенной толщины:)
вышеизложенное скорее относится к определению вида запроса, но никак не к распределению веса😒
если мы изменяем tfa, то и зависимость от нее определяем
далеко не значит. И вот почему:
1. позиции в ПС выстроены по релевантности, а релевантность 1ой позиции от 2ой может отличаться на 1, а 2ой и 3её на 10. Вот вам и линейность :(
к сведению линейно - это значит f(x)= a+ b*x , а при вашем подходе позиции могут быть одинаковыми при любых видах функции, если она возрастающая и непрерывная.
и что в итоге получим? позиции сайтов. как вы собираетесь анализировать эти данные?
в лучшем случае из этого эксперимента получите, что передача веса зависит от IDF, что и так понятно. А линейна или нет - не получиться выяснить.
пока не знаю в чем мерить эффект. В позициях неправильно(он выше на 20 значит линейно или что-то подобное), другого не нашёл еще. Но должно что-то быть☝
я исходил из анкорных весов, хоть и приближенных. методика определения не идеальна, но порядки сказать можно.
сильной зависимости не может быть от позиции слова в анкоре, поэтому это можно отложить до лучших времен:)
проектов несколько, месяца регистрации(в индекс почти сразу +2 недели к регистрации) - март, октябрь, конец августа. Двигались внутряком. С ними все впорядке, в топе.
Есть и другие. Регистрация + индексация: март, август. Двигались внутряком. После 20-ого выпали из топа.
в том-то и интерес, что веса нормируются таким образом, что разброс не большой и редкие слова не могут сильно влиять на вес остальных слов в анкоре.
меньше, больше так понятно. на ваш взгляд линейно распределяется или хитрее?
поспешил с мнением.. все как раз наоборот :) чем больше idf у слова в тексте ссылки, тем больше ему должно передаваться.
у слова "кондиционеры" вес сущесвенно выше, чем у слов "купить" и "Panasonic", поэтому эти два варианта не сильно будут отличаться.
ага, понял уже. ну, это очевидно, что такое утверждение не верно и не логично.
Только вопрос-то все равно открытый на суммарный вес нормируется или как-то по-другому.
например, запрос из двух слов состоит. У одного вес1= 1, у другого вес2=3 - кому сколько достанется?