Комментарии - wolf - Профиль вебмастера - Форум об интернет-маркетинге

12 ноября 2009, 18:32

G00DMAN:
Под гриди алгоритмом в пдфке понимается вполне определенный, без всяких наверняка метод аппроксимации. Яндекс не впервые использует этот метод, в частности на РОМИП 2008 они говорили об этом алгоритме, как о дающем лучшие результаты в задаче параметрической оптимизации поискового алгоритма.

Надо покопаться в этом гриди. Походу, на буках обновили формулу-то. Витать, шустрый обучающий алгоритм.

G00DMAN:
http://alsafr.livejournal.com/7802.html, метод TreeNet - это и есть наш гриди.

TreeNet эволюционировал в MatrixNet? :) А что тогда про генетику на РОМИП'2009 вещали? Типа перспектива на будущее? По классификации "Learning to Rank for Information Retrieval" RankBoost (насколько я понимаю, тот самый гриди) - это 2003 год, а генетический RankGP - таки 2007-й

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 16:53

G00DMAN:
где критерием выступает минимум суммы квадратов разностей обучающих и "восстановленных" значений по всему множеству пар запрос-документ

Квадрат разности я там вижу, как один из примеров функции потерь (Examples of loss functions).

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 14:28

lcatlas:
Wolf, отбросил идею того, что апы в буках могут идти по каким-то "тематикам". Из этого следует, что генетический алгоритм, который меняют на ходу (подкручивая выдачу), должен изменять все сайты и должен бы был быть пересчет сразу везде (притом достаточно серьезный), чего мы впринципе не наблюдаем...

У меня есть единственное объяснение этого - это то, что запросы с плохой выдачей тут же кидают на оценку асессорам, затем включают в обучающую выборку и тут же переобучают алгоритм. Тогда большая движуха именно по этим запросам объяснима. Но данный метод представляется нерациональным с точки зрения ресурсов - каждый день строить новую функцию ранжирования, наверняка весьма ресурсоемко. Целесообразней набрать кучу плохих примеров, скопом закинуть в обучающую выборку и сделать большой пересчет. Хотя изнутри, оно, конечно, виднее. :)

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 14:23

prinum:
так вот - апроксимация направлена на поиск коэффициентов влияния каждого из параметров ранжирования?

Сначала - выбор вида функции, затем - определение коэффициентов

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 13:50

lcatlas:
Под кластерами я имел ввиду смежные запросы. Скачать фильмы онлайн, фильмы онлайн, фильмы бесплатно, кино бесплатно.

Вы серьезно полагаете, что в Яндексе запросозависимая архитектура? :)

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 13:18

devzev:
Это что-то меняет?

Естественно. Ваше округление начинает выглядить глупо

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 12:43

devzev:
А то, что параметров ровно 1000 - я сомневаюсь. Возможно их 768. Так, округлили для статистики.

Вообще-то в оригинале речь шла о "нескольких тысячах"

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 12:08

yanus:
Ну, сегодня, например, Медведев речь толкунул не хуже. Не то ,чтобы он врал, Боже упаси о родном Президенте такое говрить, - так, слегка преувличивал, причем на всю страну.

Это называется - статистика ;)

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 12:08

devzev:
Ну всё, это потеря потерь.

Похоже на то при таких-то фантазиях 😂

Снежинск - новый алгоритм ранжирования

12 ноября 2009, 12:05

praide:
Вот вам и дополнительные параметры- группировки запросов (ИМХО по темам)
Вчера в 18 мск фото апнулось, сейчас развлечения....
Теперь апы по тематикам?

Анекдот про апдейт в строительной тематике уже стал бородатым

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

wolf