Dryoma

Dryoma
Рейтинг
12
Регистрация
24.12.2007

в Яндексе сидят неглупые ребята. Чего стоит один Садовский. В любом случае выдачу от говнеца отчистили. Если вы попали под несправедливые фильтры --- обращайтесь к Платонам, они должны все поправить :)

Jozian:
Vergiliy, http://mk.ru/ - гляньте footer и так примеров тысячи, так что решайте сами...
VIM:
12к тИЦ Интересно сколько мордашка такая стоит..
Dnn:
А смысл?))

Решил посмотреть что оно таки дает и обнаружил странную вещь.

Там есть анкор с текстом "шины по оптовой цене с доставкой по Москве". Так вот, если вбить точное вхождение всей фразы, то находится как донор так и акцептор. Если вбить точное вхождение "шины по оптовой цене с доставкой", то донор и акцептор меняются местами. А по точному вхождению "шины по оптовой цене" находится только донор. Как это объяснить?

drCurpatov:
Если вы оцениваете влияние нескольких стат факторов на конечную величину, то наиболее вероятно (опять же так обычно себя ведут статистические законы) ваше влияние описано функцией вида "сумма(коэффициент*фактор влияния)"

Можно ссылку на это утверждение в авторитетных источниках?

drCurpatov:
Чтобы коэффициент распадался на множители нужны тоже очень веские доводы связности этих множителей и зависимости их друг от друга, как правило такие связи очень редки.
drCurpatov:
связь xy как правило говорит о эффективности на кол-во, например число рабочих на время - это человеко часы производства чего либо. А вот возраст домена на кол-во ссылок - это что? что-то вменяемое?
Именно поэтому теория ху не вызывает доверия - нет доводов.

В формуле TF*IDF кто эффективность а кто рабочие? Если вы вдруг скажете, что IDF это эффективность, а TF --- это рабочие, то почему бы трасту не умножаться на виц (например, траст это эффективность, а ВИЦ --- рабочие):)

Если вы таким образом аргументируете умножение, интересно, как вы аргументируете, например логарифмы.

drCurpatov:
мое мнение, что все доверительные коэффициенты если и есть, то строятся как обычно по правилу порога, поясню, на примере, показательной пороговой функции:
Y=1-1/(X+1) рассмотрим при X >= 0 - например, это возраст сайта

Я никакого порога на гиперболах не вижу.

xant:
Что значит "нужно"? Если вы просто так балуетесь - то конечно пожалуйста, берите хоть произведение, хоть косинус между словами вычисляйте (с) яндекс. Но вот если вам нужно получить математически обоснованный результат при обсчете большого количества данных, то такое баловство уже не пройдет.

В физике значения почти всех величин распределены по Гауссу, тем не менее формулы бывают достаточно сложными.

Уверен, что для Яндекса важнее чтобы в топе были релевантные сайты, чем чтобы погрешности величин которые входят в их формулу складывались так как вам нравится.

Я не агитирую ни за какие произведения, просто ваши аргументы неубедительны.

xant:
Тогда операция смешивания изображений будет иметь вид:
C = alfa*A + (1-alfa)*B

Шумы тут ни при чем.

xant:
Операция произведения используется для гамма-распределения (гамма-функция это обобщенный факториал).

Гамма-функция в гамма-распределение входит только как нормировочный множитель, а собсно распределение x^n exp[-x]

xant:
Так вот, из мат. статистики следует, что для вычисления совокупного влияния нескольких факторов, подчиняющихся закону Гаусса, необходимо использовать сумму этих факторов.

Ну и словечки!! Совокупное влияние 😮 Это еще что? А что если мне не нужно ваше совокупное влияние а нужно просто произведение?

xant:
Что будет, если взять неправильную операцию, например, произведение для гауссовых величин? Ничего хорошего не будет) Функция будет вести себя неадекватно: игнорировать любые изменения одних факторов и "колбасится" от небольших изменений других.

Вообще говоря то, как меняется произведение xy при изменении x и y определяется только лишь частными производными. Причем тут вообще функции распределения 😮?

devzev:
Дискретный он, с точностью до некого порядка.

Я тоже так написал --- по другому и быть не может)))

богоносец:
Оставим этот термин зарезервированным за вИЦ

ТС походу путает траст и вИЦ

devzev:
Не могу.
Алгоритмы Яшки всё время самообучаются. Да и время нахождения на "раннем этапе" варьируется от "поведения" пациента.

Вот пульт за этот период принимает константу равную 6 месяцам.

Яндекс любит стабильность. Он любит когда ссылки на пациента равномерно наращиваются или равномерно убывают. Он любит когда контент регулярно обновляется (от этого параметра зависит регулярность прихода робота на сайт). Он любит когда доноры реципиента имеют нормальное распределение по "трастовой оси". Он любит когда на донорах ссылки равномерно появляются и не исчезают ("мерцают").

Если взять абсолютно новый сайт и купить на него множество ссылок в сапе, то время выхода из "раннего периода" значительно увеличивается.

Имхо это скорее свидетельствует о том, что на релевантность влияют некоторые факторы, которые не могут быть быстро нарощены. А время в формулу релевантности напрямую, может быть и не входит.

HruPifPaf:
Если бы яндекс всерьез взялся за дубли, то уменьшилось бы на 50% количество страниц, а не на 3 как сейчас.

+1

Обидно что интернет превращается в срач (как телевизор) и я в этом принимаю участие. Имхо если убрать все дубли и дорвеи и просто чушь, то индекс сократился бы на 99 процентов.

Mantius:
Так, у вас есть ответ или нет? Если нет ответа, зачем флудить в теме вопросами вроде "а зочем ви спrашиваете?" "А какая разница?"?

Ну, например, траст это число от 0 до 1 с 10ью знаками после запятой. Это для вас непрерывно или дискретно? При каком количестве знаков после запятой у вас дискретно превращается в непрерывно?

segavor:
Какие могут возникнут проблеммы в этом приемущества тут на лицо

Могу только догадываться что вы имеете в виду.

Если ваш список формирутеся на основании голосов пользователей, то ваш поисковик очень уязвим к продвижению. Если же список который я использую формируется на основании только моих голосов, то такой поисковик никому не нужен. Я как правило ищу сайты на которых еще не был. А то что вы предлагаете это скорее закладки/соцзакладки.

Mantius:
Возник такой вопрос: какой характер поведения(дискретный/непрерывный) у этих величин при расчете влияния на выдачу?

А вы уверены что возраст сайта влияет на выдачу, а траст вообще существует? Если таки существует и влияет, то какая разница, изменяется непрерывно или дискретно?

Mantius:
Также с трастом: скажем, сайт продвигается по запросам "рога" и "копыта", но среди внутренних страниц есть страница про "комбикорм", которая не имеет ни одной ссылки извне на себя. По мере роста авторитетности сайта эта страница поднимается в выдаче: будет ли этот подъем плавным по мере прибавления количества ссылок(за каждую ссылку) на другие страницы сайта или он будет носить скачкообразный характер, например, прибавляя одну у.е.(условную единицу) авторитетности за каждую сотню входящих ссылок?

У вас какое-то нетрадиционное представление о трасте.

wildgeese:
краткий фак:
1 - на продвигаемую страницу вешаем ссылку с морды, текст ссылки и есть продвигаемый запрсос
желательно еще с нескольих хороших внутряков такжу поставить ссылку
2 - с "конкурентной" ненужной страницы убираем из тайтла запрос, в тайтл продвигаемой вставляем запрос.
3 - ставим на продвигаемую страницу хороший уник текст с нужным запросом
4 - ждем апа и наслаждаемся результатом
с вас пеффко

Имхо интересно не только то как это исправить, а и то, почему это происходит. Я сам неоднократно замечал подобные явления --- Яндекс как бы путает два сайта.

Всего: 58