G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
leonid.ws:
На форуме есть закрытые разделы?

Скорее всего тема пока удалена не окончательно и обсуждается в закрытом разделе модераторами. Видимо не все из них согласны с удалением. :)

yanus:
масса народа похоже не знала, что геопривязка сайтов идет отдельными апами.

Я вот не знал. Любопытно.

Женя, ты уже собираешь столько данных, что пора прогнозировать. И создавать темы "Внимание: ап через 2 часа!" :D

wolf:
В общем-то, я больше больше вопросов не имею.

О, наконец-то дошло, хотя у меня и есть сомнения в том, что дошло правильно. :)

wolf:
Оказалось всё еще лохматей.

Опять без аргУментов. Зачот. :D

wolf:
Прогнозирование на основе статистических ретроспективных данных. Удачи в точности прогноза на живых, а не специальным образом составленных коллекциях. Она в таких случаях очень пригодится. Впрочем, не синоптики, сильно ругать не будут :)

Кстати, синоптики сильно выросли за последние годы, и в качестве прогноза, и в мат. аппарате, и технически. Там очень интересно стало, много реального креатива. Если же ты имеешь ввиду прогнозы прошедшего лета в центральной России, то любой математик тебе скажет, что спрогнозировать аномалию было в принципе не возможно. :)

За пожелание удачи спасибо. :)

aalexeev:
а нафига нужно гадать какой сайт попадет под АГС а какой нет? тем более что под АГС нормальные сайты кидает очень часто

А кто гадал на попадалово под АГС? :)

физег:
Забаньте Гудмана тогда уж...может от этого у вас удлиннится тогда...:)

А вдруг удлиннится? Тогда мне из бана не вылезти, пока не переведутся банщики с коротким. :D

beginerx:
э-э-э как-то непонятно, что собственно критикуется? отрицается само существование НС? отрицается возможность обучения НС? Отрицается возможность создания статистически репрезентативной выбоки в 10к сайтов? В чем вред или неверность "вероятность выпадения страниц"?

beginerx, не, все гораздо забавнее. Вольф на протяжении всей ветки приписывает мне разнообразные мысли и действия, из серии "а тут гудман делал так", которые не имеют никакого отношения к действительности. После чего бодро их критикует. Заодно все это зафлуживается непонятными людьми и разбавляется ехидными комментами, типа "гудман слился", "гудман дует щеки", "гудман напускает туману". Ну ржака полная. :D

Побочный эффект у ветки печальный - Вольф наделал столько серьезных математических ляпов, что был временно вычеркнут из списка математиков. Надеюсь, что временно, головокружение от маркетинговых успехов иногда лечится.

G00DMAN добавил 30.08.2010 в 16:21

wolf:
Под оценкой я понимаю параметр выборки, который вы, в общем-то, не можете объективно измерить. Поэтому и называете его вероятностью. Уж кто ее там оценивает - специально обученный человек (как асессор в Яндексе) или вы там себе правило какое-то эмпирическое придумали - не суть.

Что еще за параметр выборки? Не зная структуры выборки я могу навскидку назвать только один ее параметр - размер. Он легко считается, если что. :)

Если ты имеешь ввиду вероятность выпадания страниц на конкретном сайте, то да, такой параметр у сайтов в выборке есть, о чем уже неоднократно писалось. И при наличии длинной истории закупки с этого сайта он легко считается стат. методами. :)

wolf:
Про "более подробно" - это, скажем так, не совсем соотвествует действительности. Только туману напускается всё больше и щеки надуваются всё сильнее.

Ну ты опять начинаешь дешевый базар? :)

Такие заявления аргументировать нужно.

wolf:
Вот, наконец-то узнали, что оценкой в обучающей выборке является некая "вероятность выпадения страниц". Или опять неверная интерпретация тумана?

Что ты подразумеваешь под "оценкой в обучающей выборке"? Расскажи, и мы тоже поймем, поняли ли вы хоть что-то, или опять не дошло.

XPraptor:
Но вы же не отрицаете, что использовали заранее отобранную выборку "плохих" и "хороших" сайтов для обучения?

Не было разделения на две группы плохих и хороших. У каждого сайта был процент "плохости" (т.е. вероятность выпадания страниц), по нему сайты были разделены на несколько групп.

wolf:
Аргументация всё солидней... :)

Ну ты делаешь какие-то забавные выводы, тебе говоришь - выводы не верные, но ты не врубаешься. Тебе более подробно все расписываешь - ты опять не врубаешься и снова гонишь свое. Я понимаю, что расписав тебе подробно алгоритмы вопрос может и решится (если ты наконец врубишься), но желания такого ни разу нет, технологий я раскрывать до конца не буду, т.к. там есть, чего прятать. :)

wolf:
Походу, пустое жевание слова "халва" мало у кого вызывает ощущение сладости. Уж попросил бы своих кандидатов в доктора матчасть тебе подтянуть, что-ли... ;) Хотя это еще большой вопрос - нужно ли оно им. :)

Что за кандидаты в доктора?

dlyanachalas:
Тогда давайте говорить прямо. Если бы у вас получилось создать модель "плохих ссылок", то вы бы получили набор факторов, который в 100% случаев приводил бы к выпадению ссылок. У вас же получилось 5-10-20 % (вы сами не говорите, сколько точно, но ясно, что немного), а значит в вашей модели очень много неучтенных факторов (в несколько раз больше, чем учтенных) и точность не выше того, что можно получить экспертной оценкой.

Точность на тестовой выборке была приемлемая. Естественно, я не могу Вам гарантировать, что она такой будет на реале и всегда. Что получится в итоге - покажет время, мне самому интересно. :)

miker81:
Немного непонятно, как Вы выбирали сайты, которые не выпадут из индекса (для обучающей выборки, да и для тестовой тоже). Можно немного пояснить ?

Мы не выбирали сайты, которые выпадут. Мы считали вероятность выпадения страницы на сайте и много других параметров. На основании большой статистики сайта за длительное время его работы на бирже. Выбирались в первую очередь сайты, по которым статистических данных больше.

XPraptor:
Изначально вы вели беседу о том, что определяете вероятность выпадания страниц на основе имеющихся у вас сайтов.

Да.

XPraptor:
Одни сайты имели один полюс - ссылки будут выпадать, другие второй полюс - ссылки не будут выпадать.

Нет, ну вы сразу же себе противоречите. Мы прогнозируем вероятность, а не да/нет. Никаких полюсов не было, вы их сами придумали. :)

wolf:
Ну, раз не бузина, то по текущему "проценту выпадения" обучали. То есть по факту попадания под АГС. А теперь возвращаемся к первому посту топика и читаем всю ветку заново :)

Логика зачетная. :D

XPraptor:
Из ваших слов - вы даете на результат выборку под АГС и НЕ под АГС.
Вы пытаетесь создать сеть прямого распространения обучив ее обратным методом. А здесь более подойдет генетика но не в чистом виде, а с примесью самоорганизации.

Я в этой ветке уже раз пять наверное писал жирным шрифтом, но могу и в шестой написать: НС не определяет АГС. :D

Как можно вообще общаться с людьми, которые приписывают мне свои выводы, или свои предположения? Только потому, что на другие варианты у них моска не хватает. И при этом я должен доказывать, что не дурак. Вот же ржака... :D

wolf:
Ссылочная динамическая или ссылочная статическая? Или обе разом? И кроме ссылочных и текстовых мы ничего больше не знаем? Или не хотим знать?

Динамическая, если я правильно понял твои термины.

wolf:
В твоем посте было словосочетание "прогнозный процент выпадания ссылок" как мера эффективности. Значит, логично предположить, что обучение идет на некоем текущем проценте выпадания этих ссылок, зафиксированном у элементов обучающей выборки. Или обучаем на бузине, а эффективность меряем по дядьке?

Ну с логикой у тебя всегда здорово. Или так, как ты сказал, или бузина. :D

Я же писал выше - подробнее комментов не будет, достаточно. Можешь и дальше строить свои логичности и на их основе делать обличающие выводы, это прикольно читать.

wolf:
Произведения, говоришь... Ну, вот они, полиномчики, и выскочили, родимые, правда в другом ракурсе... :) По сколько факторов кучковал, если не секрет?

Ну это же в факторах, а не в плюс к матрикснету. Или для тебя разницы нет? Главное, чтобы слово полином было, да? Я не удивлюсь, если там и среди 420+ полиномов немеряно.

Я кучковал по 2, не секрет. Потом считал корреляцию с отобранными ранее, не все произведения прокатили.

wolf:
Объективно на субъективный гудмановский взгляд :)

Да ладно. Мираж публично признал ошибки. Ты же сначала предложил засунуть на вход модели говно, обозвав его добром, чтобы даказать, что модель УГ. Потом предложил засунуть на выход модели говно, обозвав его добром, с той же целью. Ну и в заключение ты предложил сложить кусочную функцию с полиномом, чтобы получить гладкую. Тут этих твоих перлов может никто и не понял, т.к. с математикой слабовато у читателей, но перлы были зачетные. :D

dlyanachalas:
Поясню. Ваши исследования показали, что вы разнесли сайты на группы по каким-то параметрам, в которых расчетный процент выпадения ссылок совпал с реальным. Так?

Нет, не так. Разнесение на группы было по проценту выпадания.

dlyanachalas:
Вы же эти данные усреднили и получили (возможно) неверные данные.

Да ничего мы не усредняли, Вы просто поняли как-то загадочно.

XPraptor:
Это именно так и будет.

НУ-ну. :)

XPraptor:
ошибка заключается именно в том, что вы строите сеть на конкретной выборке сайтов двух полюсов, которые в момент построения сети имеют всего два полюса - да и нет.

Что за бред? Это еще почему? Откуда два полюса? :D

basilic:
А чему там можно поучиться? Новое всегда является модной фишкой. Или ты о математике?

Это только кажется. Ты просто пока не сделал свой агрегатор, потому и непонятно. :)

Всего: 1960