Не, Михаил, там же гипотезу я рассматривал, а не утверждал. Я все же надеюсь, что такого не будет никогда. :)
Мне тока фанклуба еще не хватало. Фанатов лучше отстреливать на взлете... :D
Fresher, не сотворите себе кумира, это 100% плохо кончается.
Тут спор беспредметный, по понятным причинам. Но у меня есть некоторая уверенность, что на любую детекцию при той гипотезе я найду сильный аргУмент. Все же мы живем в одной большой деревне, какая-то инфа регулярно просачивается. ;)
Оптимизатор. Работаю. Потокового сео нет, влом. :)
Ну да, но тогда Садовский не корректно выразился, ведь пэйджранк может реально рулить в ранжировании. Для какой-то части сайтов. :)
Возможно, что в предыдущих методах IR они долго танцевали с бубнами при выборе интервалов для оптимизации коэффициентов у слагаемых, особенно с пэйджранковыми вхождениями, как вариант. Если они генетикой оптимизировали, то там выбор интервалов - "наше все", но решается только бубном и удачей. Я не так давно пару лет подряд терзал кучу железа на таких задачах, с нулевым выхлопом в итоге. Не всегда красивая подгонка на большом подмножестве дает качественную функцию на всем множестве. :)
G00DMAN добавил 30.11.2009 в 01:10
Связи нет, события независимые, но при той гипотезе это две половинки одной задницы. :D
С одной стороны много зафильтрованных реабилитировали (к сожалению), с другой, если к тому же убрать и пэйджранк, то многие из них по оставшимся характеристикам не уступят вайт-листовым.
Похоже, я тут ошибся. Если учесть реплику Ильи Сегаловича:
Признаков документа не было меньше. Если пэйджранк убрали из признаков, то их сейчас стало меньше. :)
Стат.вес страницы - функция от стат.веса доноров, как внешних, так и внутренних.
Если верна гипотеза о том, что убрали пэйджранк, то, вместе с имеющейся информацией о текущем состоянии ранее зафильтрованных доменов, это давало бы забавный результат. Типа дорогая закупка по хитро просчитанному вайт-листу крупной компании ничем бы не отличалась от закупки нулевых центовых говносцыл. :)
В стат.вес не нужно текстового добавлять. Старая формула PR от гугла вполне покатит.
Нет, написано же там, вхождениq в список признаков документа.
Ну я же написал выше, что машинное обучение не вчера ввели. Т.е. все коэффициенты давно вычисляются алгоритмически, а не задаются вручную. Поэтому какой вес в ранжировании был у пэйджранка - решал алгоритм, и при пересчете ранжирующей функции он вполне мог сильно колебаться. Если какие-то элементы пэйджранка сейчас используются в виде первичных признаков пары (запрос,документ), то их влияние на ранжирование вообще не отследить никак, не возможно сказать, сильно влияет или слабо в среднем по больнице. :)
Это не факт. Если гипотеза о том, что пэйджранк не используется совсем, верна, то забавная ситуация получается. Не в пользу монстров с крутыми аналитиками. :D
Я на самом деле даже общался с руководителем Pernod Ricard в России когда-то на какой-то тусе, там не простая ситуация с cognac, но я реально забыл все, склероз... :(
Pernod Ricard владеет несколькими серьезными коньячными брендами и под этим соусом вроде в каких-то странах продавили cognac, но не во всех. Сейчас посмотрел на оф. сайтах, на комовском (указал, что я британец) - brandy, на русской версии - армянский коньяк. :D
Конечно он "не такой как", но видимо считается вполне приличным пойлом. :)
Мы, кстати, почему-то не обсудили еще фразу Садовского "MatrixNet победил пэйджранк".
Я уже писал где-то недавно, что у разработчиков поиска (по-крайней мере у российских) пэйджранк обозначает любым образом посчитанный стат.вес документа в коллекции, это вовсе не PR в смысле гугла. Хотя гуглоиды на конфе наверное поняли фразу Садовского как "Яндекс победил гугл", потому и пытались подколоть. :D
Дык, что значит, что победили пэйджранк? Ведь в предыдущих версиях алгоритма также применялось машинное обучение и пэйджранк был только одним из многих первичных признаков. Который мог быть представлен как общим стат.весом документа, так и суммами стат.весов некоторых групп анкоров, разделенных, например, по мадриду, или еще как. Т.е. один из вариантов трактовки фразы Садовского может быть таким - либо часть вхождений, либо все вхождения стат.веса больше не участвуют в списке признаков документа.
Какие еще могут быть варианты победы матрикснета? 🚬
Не раз ведь уже писали - статья УГ.
Создается впечатление, что каждый следующий клон тормозит больше предыдущего. Клоноводство, похоже, конкретно влияет на автора. :D