Объясните переколдовку

123
Каширин
На сайте с 03.01.2004
Offline
1030
#11
Олежина:
Ведь, на сколько я понимаю, цифры это это параметр idf.

Редкость термина в коллекции?? 😎

О
На сайте с 27.05.2006
Offline
79
#12
Каширин:
Редкость термина в коллекции?? 😎
Ранжирование в модели TF*IDF основано на естественном статистическом наблюдении, что чем больше локальная частота термина в документе (TF) и больше «редкость» (т.е. обратная встречаемость в документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину.

Разве не так?

pro-maker
На сайте с 08.12.2003
Offline
281
#13
Олежина:
слово1::1537336 && слово2::19765 &/(0 0) !!%слово2::1819103916

Предположу, что пассаж "слово2 &/(0 0) слово2" надо понимать как слово2 на нулевом растоянии от себя самого, т.е. суммировать веса (19765+1819103916), что должно повысить значимость точного вхождения.

О
На сайте с 27.05.2006
Offline
79
#14
pro-maker:
Предположу, что пассаж "слово2 &/(0 0) слово2" надо понимать как слово2 на нулевом растоянии от себя самого, т.е. суммировать веса (19765+1819103916), что должно повысить значимость точного вхождения.

Может, это некий аналог оператора "|" (или), т.е. найти "слово2|!!слово2", но документ содержащий "!!слово2" (по-этому у вес передается этому слову соответствующий, на несколько порядков больше) намного релевантнее чем документ, просто содержащий "слово2"

Каширин
На сайте с 03.01.2004
Offline
1030
#15
pro-maker:
Предположу, что
Олежина:
Может, это

Именно об этом я писал. Никто не знает - есть только гипотезы.

euhenio
На сайте с 21.09.2001
Offline
357
#16
pro-maker:
&/(0 0) !!%слово2

-это усиление веса точной формы слова. При том, что найденными будут считаться пассажи и с неточной формой тоже.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
[Удален]
#17

то что касаеться ::1819103916

какая-то константа в Яше для варианта поиска, т.к. данная величина встречается и в других запросах в частности в url на сохранённые копии по запросу link="....."

A
На сайте с 01.07.2005
Offline
68
#18
euhenio:
-это усиление веса точной формы слова. При том, что найденными будут считаться пассажи и с неточной формой тоже.

Евгений, это усиление веса слова, только непонятно, почему у слова2 в переколдовке приписаны 2 разных веса - один в усилении %, другой в reqtext

это случайно не константа, которая для всех больших весов указывается, и больше нее нет?

О
На сайте с 27.05.2006
Offline
79
#19
burunduk:
то что касаеться ::1819103916
какая-то константа в Яше для варианта поиска, т.к. данная величина встречается и в других запросах в частности в url на сохранённые копии по запросу link="....."

Вероятно, есть предел редкости слова, начиная с которого, всем словам назначается такой вес

euhenio
На сайте с 21.09.2001
Offline
357
#20
attack:
слова2 в переколдовке приписаны 2 разных веса - один в усилении %

-для точной формы один вес, для остальных форм - другой, а про оператор % я Минычу обещал никому не говорить :)

attack:
это усиление веса слова

-я вроде написал точной формы слова :)

Как правило, бывает для очень редких слов.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий