А есть где калькулятор для BM-25?

oleg1979
На сайте с 23.07.2010
Offline
187
2256

Хотелось бы онлайн расчет BM-25.. Есть где?

Консультирую по всем вопросам, связанным с запуском интернет-магазина
S6
На сайте с 17.06.2009
Offline
117
#1

allsubmitter чото считает, только вот зачем оно Вам?

samimages
На сайте с 31.05.2009
Offline
427
#2

oleg1979, там калькулировать нечего в рамках сайта, но чувствовать спинным мозгом надо))) в рамках, хотябы тематики. И лучше тогда BM25F...

Опыт как иммунитет — приобретается в муках! Аудит семантики от 15К [долго] - ЛС
SmileP
На сайте с 18.02.2010
Offline
386
#3

Не встречал, самому интересно найти :)

---------- Добавлено 18.04.2013 в 02:24 ----------

samimages:
лучше тогда BM25F...

там коэффициенты ещё нужно подбирать для областей страницы.

samimages
На сайте с 31.05.2009
Offline
427
#4

Да там много чего надо для конкретизированного результата пересчета. Плюс добавить то, что дописали программеры поисковиков. Плюс выпытать общую архитектуру проиндексированных "документов", ну и конечно, было бы не плохо, обновлять всю эту кухню вместе с апами индекса.

Так что кроме правильного понимания этой формулы и чутья, считать там особо нечего. Вот и калькулятора нет.

Ципф в этом случае более интересен ибо все, что выше его законов, является коммерческой тайной ПС

Можно пользоваться поиском яндекса по сайту... это по сути и будет калькулятором релевантности внутри узла.

SmileP
На сайте с 18.02.2010
Offline
386
#5
samimages:
Вот и калькулятора нет.

Калькуляторы и всякие анализаторы по TF же есть :)

Да, в докладе яндекса от 2006 г. на РОМИПе по текстовому ранжированию в одной формуле TF- обозначили "число вхождений леммы в документ", хотя общепринято: "TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа" вот и пойми- опечатка или нет:)

samimages:

Так что кроме правильного понимания этой формулы

Избитое- не спамить и релевантность больше, чем больше мало встречаемых слов (по idf а лучше по icf) из запросов?

samimages:
Ципф в этом случае более интересен ибо все

Стоит на него обращать внимание? Толком с ним не работал.

samimages:
это по сути и будет калькулятором релевантности внутри узла.

Калькулятор будет с учетом штрафов.

---------- Добавлено 18.04.2013 в 13:36 ----------

samimages, по БМ25F есть примеры использования? Не нашел ничего интересного, только- "модификация", "учитывает теги".

wolf
На сайте с 13.03.2001
Offline
1183
#6
SmileP:
Да, в докладе яндекса от 2006 г. на РОМИПе по текстовому ранжированию в одной формуле TF- обозначили "число вхождений леммы в документ", хотя общепринято: "TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа" вот и пойми- опечатка или нет

Кем общепринято? Русскоязычной Википедией? TF - это именно число вхождений. И frequency тут не частота, а частотность.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
богоносец
На сайте с 30.01.2007
Offline
774
#7

И не надоест вам жрать эту падаль?

samimages
На сайте с 31.05.2009
Offline
427
#8
SmileP:

Да, в докладе яндекса от 2006 г. на РОМИПе по текстовому ранжированию в одной формуле TF- обозначили "число вхождений леммы в документ"

здесь ключевое слово - лемма

---------- Добавлено 20.04.2013 в 23:50 ----------

SmileP:

Стоит на него обращать внимание? Толком с ним не работал.

В отдельных задачах стоит именно обращать внимание, а в общем можно только анализировать разность подачи материала, например при сравнении документов на разных сайтах одной тематики...

SmileP:

samimages, по БМ25F есть примеры использования? Не нашел ничего интересного, только- "модификация", "учитывает теги".

В примитиве - любая ПС. Велосипед они точно не изобретали...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий