Это да. Коля молодец, у него остальным агрегаторам еще многому можно научиться. :)
Примерно так. Ссылочная у меня равна нулю.
Слова гудман не было - факт, но идеолухом статьи в ветке выступал именно я, без вариантов, потому и воспринято было соответственно. Ну и видимо еще приплюсовано к обвинению в идейном пЕАразме. :)
Что такое "текущий процент"? В моем посте не было такого словосочетания. Тонкости я не вижу смысла озвучивать нахаляву, так как там есть хитрые моменты, до которых еще додуматься нужно. :)
Яндексоиды раньше брали произведения, они об этом официально говорили. Сейчас скорее всего тоже, но инфы точной нет. Я также брал произведения.
Не понял вопроса.
Где я слился? Будь добр, покажи. И ты не ответил на мой вопрос из #114, на таком уровне дискуссию не получится вести, мну маркетологическими хитростями трудно задолбать. :D
А великого математика я из себя тоже не строю. Но объективно на сегодня между нами тремя к математику как-то близок только я, что и было в ветке показано не раз. :D
Не, ну факторов не 420+, этого явно не хватит... 420 - это основных, и стопиццот производных от них. В каждом дереве - 10 факторов.
В обучающей и тестовой выборке - сайты, а не документы. По данным сайтам есть как длинная история параметров самого сайта, так и история всех купленных на нем когда-либо ссылок. По некоторым параметрам история не очень длинная, но она тоже есть. Слов типа "вектор" я не буду употреблять, чтобы больше народу поняло. Из этой большой истории сайта и ссылок, а также из других свойств сайта формируется набор факторов, который задействован в обучении. На выходе - прогнозный процент выпадания ссылок.
Все сайты в обучающей и тестовой выборке были разбиты на группы по этому проценту выпадания, т.е. от и до. Правильным считался прогноз, при котором прогнозный и реальный проценты попадали в ту же группу. Эффективность измерялась, как процент правильных прогнозов.
Примерно так. :)
lcatlas, ну тут каждый будет решать самостоятельно, что ему лучше. Я убеждать никого не хочу, т.к. у меня нет достаточного количества данных.
G00DMAN добавил 29.08.2010 в 22:44
Дык это было после того, как ты меня обвинил в тупке с определением уже наложенного АГС. :)
Ну, типа ты первый начал, однозначно. :D
А я еще раз не поленюсь повторить - НС не определяет АГС. :D
Нет, в обучающей выборке были не только молодые сайты, было много старых, которые давно в биржах. Понятно, что какой-то процент косяков будет и какая-то малая часть сайтов попадет в ГБЛ не заслуженно, но тут ничего не поделать. Точнее, можно это лечить, но я не верю, что в ближайшее время будут, т.к. геморно.
Не может, я ведь только текстовую релевантность пытаюсь отследить. Или, наверное, правильнее сказать так - если и может, то пока не стало. :)
Маленький матрикснет Гудмана с ГБЛ ничего общего не имеет. :D
С ГБЛ работает НС в Руках.
Ну и еще раз - НС не определяет АГС. :D
Если в месяц будет выпадать 1-2% вместо 5-10% или 20%+, как у некоторых оптимизаторов, то это должно в целом повлиять на продвижение в плюс, имхо.
А можешь привести пример псевдоматематичности? Или просто так написал, чтобы лишний раз опустить конкурента? :)
Ну смысл видимо в том, что 1-2% выпадения ссылок в месяц лучше, чем 6-9%. Мне думается, что лучше. Оспорить это сложно, как и противоположную точку зрения. Т.е. тут вопрос веры. :)
Если Вы про НС, то как его будут Руки дообучать, я пока не в курсе. НС - не моя тема.
Могу рассказать про свой "доморощенный матрикснет". Есть некоторые обучающее и тестовое множества - это некие куски выдач, с фиксированным ранжированием. Если ранжирование данных выдач изменяется от фиксированного более, чем на ХХ%, мы переобучаем. Такое было пока всего один раз. Каждый апдейт переобучать не нужно, т.к. там выдачи специфические, меняются не существенно.
Ну в статье вроде было написано, на сколько я помню, или не? Фильтры разных уровней обязаны отсекать в ГБЛ сайты, на которых % выпадания страниц больше заданного.
Нейронные сети в целом - полное УГ, имхо. Когда на НС у Рук что-то стоящее получилось, я очень удивился. :)
И матрикснет к НС никакого отношения не имеет.
G00DMAN добавил 29.08.2010 в 20:56
Миша, я еще раз повторюсь - НС не определяет АГС. Сколько еще раз нужно повторить? :D
Повторюсь еще раз. НС не определяет АГС. Это никому не нужно. Но сайты, на которые в будущем будет наложен АГС, попадают в ГБЛ.
Да ладно, ты же меня сразу обвинил в том, что я АГС, который уже наложен, определяю с помощью НС. Т.е. обвинил в конкретной тупке. А в итоге слился, на личности перешел. :)
И на все вопросы я вроде достаточно подробно ответил, как мне кажется.
Ты путаешь. Я, в отличие от тебя, этим не занимаюсь. Мну просто не интересно. :)
Носом он ткнулся сам, однако. :D
Да вроде особого пиара с моей стороны не было. Где я писал что-нибудь типа "регистрируйтесь в Руках и будет вам щастя"? Нигде. И, кстати, - вчера я подписал с Руками договор о сотрудничестве, так что в "идейном пЕАразме" мну больше обвинить нельзя. Я помогаю им в развитии сервиса и мы ведем какие-то совместные исследования, и только. :)