wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
TimeBomb:
а h-катые (как раз обзываемые у них Weak Learners), если я правильно понял подбираются по принципу корреляции с вектором градиента.
Цитата:
Find most highly correlated with g function hk(q,d)...

Это понятно, это про выбор лучших h-катых из некоего семейства H. А что представляет из себя это "простое семейство"?

TimeBomb:
То есть на этом шаге про h-катые все-таки говорится как про функции, другое дело, что потом их заменяют некими деревьями решений.

Ну да, в итоге нарисовывается дерево решений с глубиной k и с 2 в степени k "регионами". Это и есть то самое "простое семейство" походу?

dweller:
h-катые это вообще туфта. Гораздо интересней сделать сайт, который понравится асессорам.

Угу. А еще намолить, чтоб нужные запросы попали в обучающую выборку :)

TimeBomb:
Допишу: альфа-катые при hk(q,d) - суть и есть те коэффициенты о которых заспорили Благородные Доны.

Альфа-катые - это фигня. Гораздо интересней, что из себя представляют h-катые

dlyanachalas:
Так не только G00DMAN утверждает, так ещё и Яндекс утверждает.

Где?

В том то и дело, что вся прелесть в том, что "сильным и креативным математикам" как раз-таки и не надо париться над выбором функций. Метода подберет сама

TimeBomb:
Подбор этих функций - задача оптимизации.

Вот именно. Функций от набора параметров. А коллега G00DMAN утверждает, что они задаются априори, и метода находит лишь коэффициенты

mexboy:
wolf, а разве goodman как раз не об этом пишет

Нет, не об этом. В лекции weak learner - это дерево решений на наборе параметров.

G00DMAN:
Да. Причем коэффициенты по жадному алгоритму находятся быстро. А дальше сравнивается полученная релевантность с "истинной", и, если погрешность большая, то можно увеличить количество функций/изменить набор функций/увеличить обучающую выборку/изменить "истинные" релевантности. В целом метод вполне рабочий, кстати.

Э-э-э, коллега, а как Вам представляется общее число комбинаций в случае наличие хотя бы нескольких базовых функций (допустим, таковые есть у них) для каждого параметра (напоминаю, их заявлено несколько тысяч)?.. ;) Даже, если алгоритм и супербыстр, перебирать их придется до морковкина заговенья...

burunduk:
скорей всего вид функции будет различен
мне вот интересно сколько исходных параметров используется при составлении формулы

А что-то никто не обращает внимание на "слабых учеников" (weak learners). А ведь в лекции черным по-белому написано, что функция ранжирования ищется именно в виде их линейной комбинации ;)

G00DMAN:
В Яндексе есть сильные и креативные математики, для них выбор таких функций наверное очевиден. Ну или пробуют разные наборы, экспериментируют пока. Считается-то быстро.

Хм... То есть считаете, что вид функций от f i-тых задан априори? Вот так вот, для всех нескольких тысяч f i-тых? И нужно только найти коэффициенты при них? :)

G00DMAN:
Я тут написал немного букв про Снежинск. Можно почитать, если не лениво.

Почитал. Речь идет только о подборе коэффициентов. А вид функций откуда, по-Вашему, берут? ;)

Всего: 24501