mhz

mhz
Рейтинг
190
Регистрация
16.05.2007
G00DMAN:
Я тут написал немного букв про Снежинск. Можно почитать, если не лениво.

К вам на работу никто не требуется? :D

jfar, Vicontin, Shabash85, Vadik'One, всё дело в кэше — чистите куки.

writercommunity, ну если вы уверены, что в выдача, увиденная вами, отличалась от буковской только наличием в последней зафильтрованных единичных сайтов, тогда да, фиксируем выкладку Снежинска на отдельных фронтах!

В принципе, ничего удивительного в этом нет — если уже тестят «на живом», значит совсем скоро включат. Да и быстрей бы уже...

writercommunity, так похожую выдачу или буковскую? Это важный момент. :) Похожую объяснить можно, например, так: кэш на каком-то кластере сформировался до устаканивания позиций и случайно стал похож на выдачу буки. Потом либо этот кэш переформировался, либо вы почему-то перестали попадать на этот кластер.

Вот если бы выдача была идентична буковской, то можно было бы думать.

Хотя, возможен, конечно, вариант, что выкладывают по фронтам Снежинск. В этом случае разница в позициях с буки была бы, но была бы, имхо, совсем незначительная, т. к. отличаются выдачи, кажись, только наличием фильтров.

Думается, что имеет место кривой кэш на некоторых фронтах после последнего апа, а в случае ТС — еще и кэш браузера.

Думаю, что:

Траст у вики большой - никто не будет спорить.

А в топе она из-за внутренних ссылок ведущих на страницу и из-за контента: куча текста и тошнота немаленькая (подсветите все "бан" в тексте).

vakuum, это быстроробот — уже обсуждалось не раз в этом топике.

Он стал шустрее (видимо) и теперь подмешивается в выдачу. Но он также быстро уходит, как и появляется.

G00DMAN:
Нет. "Истинная" релевантность (хотя может быть "истинная" - не верное название, может "назначенная" или еще как ), присваивается каждой паре запрос-документ до начала обучения. Ее значение как-то вычисляется, наверное по хитрой формуле какой-то, на основании оценок асессоров и еще чего-то. И суть обучения - подобрать такой набор параметров для ранжирующей функции, чтобы полученное с помощью функции значение релевантности было как можно ближе к "истинному". Для всех пар "запрос-документ" в обучающей выборке.

Становится немного понятней, спасибо! :)

G00DMAN:
Ну если в обучающею базу внести небольшие изменения, например только по одной выдаче, то в итоге получим изменения как раз по тематике - этой одной выдачи и всех близких к ней, где те же сайты в топах.

А почему это не было возможным сейчас, во время Арзамаса? Ведь алгоритм тоже обучающийся...

wolf:
И Вашего, извините, тоже.

G00DMAN сказал (если я его правильно понял), что если дать асессорам оценивать пары q,d только одной тематики (например, «окна» и 30 сайтов по ним), то изменения в выдаче после обучения алгоритма по этим оценкам коснутся только оконной тематики.

Вы с ним согласились и я задал вопрос, собственно, почему так? :)

devzev:
Показатель оптимизации текстовых привязок, например.

То есть, вы думаете, что коэффициенты этого показателя разнятся в зависимости от тематик? Типа в форексе спамность анкоров может достигать 0.6, а в "секретах вконтакте", например, 0.2?

А еще примеры есть?

wolf:
Именно подобную картину я и предположил вчера в этом топике.

Так какие факторы, например, которые алгоритм корректирует в формуле в процессе обучения, могут влиять только в рамках запроса, тематики или тематического спектра?

Большинство факторов, вроде как, не имеют тематической привязки и распространяются на все сайты.

Всего: 2083