G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
MiRaj:
Да-да-да, все на покупку говносцылок! :)

Не, Михаил, там же гипотезу я рассматривал, а не утверждал. Я все же надеюсь, что такого не будет никогда. :)

MiRaj:
Илья, ты главное после сбора фанклуба любителей математических терминов не пропади, как ХРНС )))

Мне тока фанклуба еще не хватало. Фанатов лучше отстреливать на взлете... :D

Fresher:
С жадностью вчитываюсь в каждые посты этого человека.

Fresher, не сотворите себе кумира, это 100% плохо кончается.

wolf:
А это смотря, по каким характеристикам производить детекцию ;)

Тут спор беспредметный, по понятным причинам. Но у меня есть некоторая уверенность, что на любую детекцию при той гипотезе я найду сильный аргУмент. Все же мы живем в одной большой деревне, какая-то инфа регулярно просачивается. ;)

Fresher:
G00DMAN скажите, вы оптимизатор или разработчик? вы работаете над массовым (ну или не очень) продвижением сайтов?

Оптимизатор. Работаю. Потокового сео нет, влом. :)

wolf:
Такая гипотеза: в предыдущей ипостаси алгоритма обучения было много больше свободы (или необходимости) в ручной расстановке приоритетов между факторами. А тут всё типа автоматом - нажал кнопку и кури бамбук.

Ну да, но тогда Садовский не корректно выразился, ведь пэйджранк может реально рулить в ранжировании. Для какой-то части сайтов. :)

Возможно, что в предыдущих методах IR они долго танцевали с бубнами при выборе интервалов для оптимизации коэффициентов у слагаемых, особенно с пэйджранковыми вхождениями, как вариант. Если они генетикой оптимизировали, то там выбор интервалов - "наше все", но решается только бубном и удачей. Я не так давно пару лет подряд терзал кучу железа на таких задачах, с нулевым выхлопом в итоге. Не всегда красивая подгонка на большом подмножестве дает качественную функцию на всем множестве. :)

G00DMAN добавил 30.11.2009 в 01:10

wolf:
А какая связь между фильтрацией доноров и пейджранком?

Связи нет, события независимые, но при той гипотезе это две половинки одной задницы. :D

С одной стороны много зафильтрованных реабилитировали (к сожалению), с другой, если к тому же убрать и пэйджранк, то многие из них по оставшимся характеристикам не уступят вайт-листовым.

G00DMAN:
Признаков документа не было меньше.

Похоже, я тут ошибся. Если учесть реплику Ильи Сегаловича:

по метрикам стало заметно лучше. много новых правильных факторов, влияние которых ощущается в повышении точности в десятке. а совсем конкретики действительно маловато
Fresher:
Факторов было меньше гораздо (если сейчас их действительно тысячи), поэтому он все равно имел вес. которым не стоило пренебрегать.

Признаков документа не было меньше. Если пэйджранк убрали из признаков, то их сейчас стало меньше. :)

Fresher:
На самом деле поясните, если не сложно, а то что то я совсем начал печалиться при попытки самооценить свои знания. - здесь вы имеет ввиду стат вес продвигаемой страницы? или стат вес страничек доноров при выборе?

Стат.вес страницы - функция от стат.веса доноров, как внешних, так и внутренних.

Если верна гипотеза о том, что убрали пэйджранк, то, вместе с имеющейся информацией о текущем состоянии ранее зафильтрованных доменов, это давало бы забавный результат. Типа дорогая закупка по хитро просчитанному вайт-листу крупной компании ничем бы не отличалась от закупки нулевых центовых говносцыл. :)

Fresher:
Для меня статический вес всегда олицетворялся с формулой пэйджранка и для шаманства я прибавлял еще туда некий набор текстовой составляющей страницы. Скажем в структуре инет магазина телефонов, крутящихся по запросу Телефоны странички с разделами "телефоны сименс" "телефоны нокия" были следующими весомыми практически у любого оптимизатора, далее шли уже НЧ товары. Под это и внутренняя перелинковка подгоняется, и внешнее ссылочное закупается....

В стат.вес не нужно текстового добавлять. Старая формула PR от гугла вполне покатит.

VSS:
простите, а вхождений в смысле контента документа?

Нет, написано же там, вхождениq в список признаков документа.

Fresher:
До снежинска он имел одну из самых важных значений (эхх помянем же все как просто крутились сайты), сейчас полагаю имеется ввиду что таких важных теперь столько что он уже не определяющий а так, ... типа альт в картинках прописать 😂, Даже не понимаю что тут еще обсуждать, сказали же что тысяча факторов без определяющего влияния каждого...

Ну я же написал выше, что машинное обучение не вчера ввели. Т.е. все коэффициенты давно вычисляются алгоритмически, а не задаются вручную. Поэтому какой вес в ранжировании был у пэйджранка - решал алгоритм, и при пересчете ранжирующей функции он вполне мог сильно колебаться. Если какие-то элементы пэйджранка сейчас используются в виде первичных признаков пары (запрос,документ), то их влияние на ранжирование вообще не отследить никак, не возможно сказать, сильно влияет или слабо в среднем по больнице. :)

Fresher:
В любом случае фраза ничего хорошего нам не сулит :( как не интерпретируй,

Это не факт. Если гипотеза о том, что пэйджранк не используется совсем, верна, то забавная ситуация получается. Не в пользу монстров с крутыми аналитиками. :D

Калинин:
Может быть (напряги память, плз.) в винной карте стояло обозначение Ararat brandy, а не Ararat cognac? ;)

Я на самом деле даже общался с руководителем Pernod Ricard в России когда-то на какой-то тусе, там не простая ситуация с cognac, но я реально забыл все, склероз... :(

Pernod Ricard владеет несколькими серьезными коньячными брендами и под этим соусом вроде в каких-то странах продавили cognac, но не во всех. Сейчас посмотрел на оф. сайтах, на комовском (указал, что я британец) - brandy, на русской версии - армянский коньяк. :D

Конечно он "не такой как", но видимо считается вполне приличным пойлом. :)

Мы, кстати, почему-то не обсудили еще фразу Садовского "MatrixNet победил пэйджранк".

Я уже писал где-то недавно, что у разработчиков поиска (по-крайней мере у российских) пэйджранк обозначает любым образом посчитанный стат.вес документа в коллекции, это вовсе не PR в смысле гугла. Хотя гуглоиды на конфе наверное поняли фразу Садовского как "Яндекс победил гугл", потому и пытались подколоть. :D

Дык, что значит, что победили пэйджранк? Ведь в предыдущих версиях алгоритма также применялось машинное обучение и пэйджранк был только одним из многих первичных признаков. Который мог быть представлен как общим стат.весом документа, так и суммами стат.весов некоторых групп анкоров, разделенных, например, по мадриду, или еще как. Т.е. один из вариантов трактовки фразы Садовского может быть таким - либо часть вхождений, либо все вхождения стат.веса больше не участвуют в списке признаков документа.

Какие еще могут быть варианты победы матрикснета? 🚬

1001-й фактор:
а может, все таки товарищ Эдуард Снежинский был таки прав в своей статье? Может зря его забанили и рулят теерь поведенческие факторы, одбираться к которым надо со стороны маркетинга?

Не раз ведь уже писали - статья УГ.

1001-й фактор:
И банить меня не надо....плизз. хватит уже...

Создается впечатление, что каждый следующий клон тормозит больше предыдущего. Клоноводство, похоже, конкретно влияет на автора. :D

Всего: 1960