Wolf vs Goodman - у кого математичнее

G00DMAN
На сайте с 19.04.2008
Offline
122
#191
wolf:
Аргументация всё солидней... :)

Ну ты делаешь какие-то забавные выводы, тебе говоришь - выводы не верные, но ты не врубаешься. Тебе более подробно все расписываешь - ты опять не врубаешься и снова гонишь свое. Я понимаю, что расписав тебе подробно алгоритмы вопрос может и решится (если ты наконец врубишься), но желания такого ни разу нет, технологий я раскрывать до конца не буду, т.к. там есть, чего прятать. :)

wolf:
Походу, пустое жевание слова "халва" мало у кого вызывает ощущение сладости. Уж попросил бы своих кандидатов в доктора матчасть тебе подтянуть, что-ли... ;) Хотя это еще большой вопрос - нужно ли оно им. :)

Что за кандидаты в доктора?

dlyanachalas:
Тогда давайте говорить прямо. Если бы у вас получилось создать модель "плохих ссылок", то вы бы получили набор факторов, который в 100% случаев приводил бы к выпадению ссылок. У вас же получилось 5-10-20 % (вы сами не говорите, сколько точно, но ясно, что немного), а значит в вашей модели очень много неучтенных факторов (в несколько раз больше, чем учтенных) и точность не выше того, что можно получить экспертной оценкой.

Точность на тестовой выборке была приемлемая. Естественно, я не могу Вам гарантировать, что она такой будет на реале и всегда. Что получится в итоге - покажет время, мне самому интересно. :)

miker81:
Немного непонятно, как Вы выбирали сайты, которые не выпадут из индекса (для обучающей выборки, да и для тестовой тоже). Можно немного пояснить ?

Мы не выбирали сайты, которые выпадут. Мы считали вероятность выпадения страницы на сайте и много других параметров. На основании большой статистики сайта за длительное время его работы на бирже. Выбирались в первую очередь сайты, по которым статистических данных больше.

XPraptor:
Изначально вы вели беседу о том, что определяете вероятность выпадания страниц на основе имеющихся у вас сайтов.

Да.

XPraptor:
Одни сайты имели один полюс - ссылки будут выпадать, другие второй полюс - ссылки не будут выпадать.

Нет, ну вы сразу же себе противоречите. Мы прогнозируем вероятность, а не да/нет. Никаких полюсов не было, вы их сами придумали. :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
XPraptor
На сайте с 15.10.2004
Offline
333
#192
G00DMAN:
Нет, ну вы сразу же себе противоречите. Мы прогнозируем вероятность, а не да/нет. Никаких полюсов не было, вы их сами придумали

Но вы же не отрицаете, что использовали заранее отобранную выборку "плохих" и "хороших" сайтов для обучения?

G00DMAN
На сайте с 19.04.2008
Offline
122
#193
XPraptor:
Но вы же не отрицаете, что использовали заранее отобранную выборку "плохих" и "хороших" сайтов для обучения?

Не было разделения на две группы плохих и хороших. У каждого сайта был процент "плохости" (т.е. вероятность выпадания страниц), по нему сайты были разделены на несколько групп.

beginerx
На сайте с 13.07.2009
Offline
173
#194
XPraptor:
Dubovoj,А мутация яшиного алгоритма может при следующем витке сделать часть сайтов, которые были у него в одном полюсе - сайтами другого полюса. ... В этом вся суть мутации и невозможности обучить сеть на эту тему по двум имеющимся заранее выборкам.

ваша ошибка в том что вы думаете что яндекс произвольно убивает сайты АГС-ом, тогда да,

нельзя. Но на самом деле яндекс "убивает" "плохие" сайты, по крайней мере стремиться к этому,

и потому это не мутации, а направленные изменения (несколько зашумленные). Нейронная сеть

вполне может "понять" эту логику и обучиться ей, имитировать ее.

То что сайты на границе между "хорошо" и "плохо" будут "мерцать" имхо на обучение не окажет серьезного влияния.

И маловероятно что яндекс неожиданно станет считать значительный процент ГС как СДЛ, а СДЛ как ГС.

Пример с ПР как неучтеным параметром, х-м-м-м, но если, например, учитывается параметр типа число входящих ссылок то он частично нейтрализует отсутствие параметра ПР. Так что ничего страшного в том что не все параметры учтены не будет. Функциоальность сохранится на высоком уровне.

То что НС не дает ответа да или нет, имхо лукавство, в конечном итоге принимается решение об удалении сайта

из белого списка или нет, так что решение все равно двоичное.

>>>Скорость и Реакция<<< (https://vk.com/app4629907 ): онлайн тренировка скорости и времени реакции.... (https://vk.com/app4612117 )... (https://vk.com/club18740762 ).
fireone
На сайте с 07.07.2006
Offline
127
#195
wolf:
Угу. Даже Сеопульт не выдержал, подтянулся к раздаче. Глядишь, сейчас тоже что-нибудь за математику задвинет

Сергей, Вы меня в свои "разборки - замеры" не втягивайте, пожалуйста, тем более связывая с Сеопультом ;)

Я всего лишь как сторонний не ангажированный наблюдатель мимо проходил и мнение со стороны озвучил ;)

Нужны люди: пом-ик оптимизатора () и оптимизатор () Вливайтесь в сильнейшую команду страны ;) 89057335033, Александр Шокуров;
wolf
На сайте с 13.03.2001
Offline
1183
#196
G00DMAN:
Ну ты делаешь какие-то забавные выводы, тебе говоришь - выводы не верные, но ты не врубаешься. Тебе более подробно все расписываешь - ты опять не врубаешься и снова гонишь свое.

Про "более подробно" - это, скажем так, не совсем соотвествует действительности. Только туману напускается всё больше и щеки надуваются всё сильнее. Вот, наконец-то узнали, что оценкой в обучающей выборке является некая "вероятность выпадения страниц". Или опять неверная интерпретация тумана?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
G00DMAN
На сайте с 19.04.2008
Offline
122
#197
wolf:
Про "более подробно" - это, скажем так, не совсем соотвествует действительности. Только туману напускается всё больше и щеки надуваются всё сильнее.

Ну ты опять начинаешь дешевый базар? :)

Такие заявления аргументировать нужно.

wolf:
Вот, наконец-то узнали, что оценкой в обучающей выборке является некая "вероятность выпадения страниц". Или опять неверная интерпретация тумана?

Что ты подразумеваешь под "оценкой в обучающей выборке"? Расскажи, и мы тоже поймем, поняли ли вы хоть что-то, или опять не дошло.

beginerx
На сайте с 13.07.2009
Offline
173
#198

э-э-э как-то непонятно, что собственно критикуется? отрицается само существование НС? отрицается возможность обучения НС? Отрицается возможность создания статистически репрезентативной выбоки в 10к сайтов? В чем вред или неверность "вероятность выпадения страниц"?

wolf
На сайте с 13.03.2001
Offline
1183
#199
G00DMAN:
Что ты подразумеваешь под "оценкой в обучающей выборке"? Расскажи, и мы тоже поймем, поняли ли вы хоть что-то, или опять не дошло.

Под оценкой я понимаю параметр выборки, который вы, в общем-то, не можете объективно измерить. Поэтому и называете его вероятностью. Уж кто ее там оценивает - специально обученный человек (как асессор в Яндексе) или вы там себе правило какое-то эмпирическое придумали - не суть.

G00DMAN
На сайте с 19.04.2008
Offline
122
#200
beginerx:
э-э-э как-то непонятно, что собственно критикуется? отрицается само существование НС? отрицается возможность обучения НС? Отрицается возможность создания статистически репрезентативной выбоки в 10к сайтов? В чем вред или неверность "вероятность выпадения страниц"?

beginerx, не, все гораздо забавнее. Вольф на протяжении всей ветки приписывает мне разнообразные мысли и действия, из серии "а тут гудман делал так", которые не имеют никакого отношения к действительности. После чего бодро их критикует. Заодно все это зафлуживается непонятными людьми и разбавляется ехидными комментами, типа "гудман слился", "гудман дует щеки", "гудман напускает туману". Ну ржака полная. :D

Побочный эффект у ветки печальный - Вольф наделал столько серьезных математических ляпов, что был временно вычеркнут из списка математиков. Надеюсь, что временно, головокружение от маркетинговых успехов иногда лечится.

G00DMAN добавил 30.08.2010 в 16:21

wolf:
Под оценкой я понимаю параметр выборки, который вы, в общем-то, не можете объективно измерить. Поэтому и называете его вероятностью. Уж кто ее там оценивает - специально обученный человек (как асессор в Яндексе) или вы там себе правило какое-то эмпирическое придумали - не суть.

Что еще за параметр выборки? Не зная структуры выборки я могу навскидку назвать только один ее параметр - размер. Он легко считается, если что. :)

Если ты имеешь ввиду вероятность выпадания страниц на конкретном сайте, то да, такой параметр у сайтов в выборке есть, о чем уже неоднократно писалось. И при наличии длинной истории закупки с этого сайта он легко считается стат. методами. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий