devzev

devzev
Рейтинг
246
Регистрация
13.08.2008
dmbav:
Нет, я про дискретные функции и случайные величины, на которые вы сделали упор в сравнении своего метода с методом пульта. И у меня назрел вопрос, как можно сравнивать два разных понятия (дискретная функция и случайная величина)? Просто вкупе с "опечаткой" в формуле меток и тица, а также с развитием данной темы, все это наводит на то, что вы немного плаваете в элементарной математике, при этом отправляя всех на первых страницах в вики.
Либо уже устали отвечать на вопросы - так отдохните :)

Ничего личного.

Я уже ответил на несколько сотен постов и нахожусь в непонятном состоянии. Сейчас иду отдыхать уже. :)

Я не сравнивал дискретные функции с случайными величинами. Я предположил, что второй вариант эффективнее при отборе доноров.

Смотрите, имеем дискретную функцию. Её, по идее, можно приравнять к распределению дискретной случайной величины с вероятностью появления каждого из значений = 1. :D Разве не так?

Нарисуйте на кубике только единички на всех гранях... типа того.

Serg_33:
Мдя а все так хорошо начиналось и теория отличная была только от нормальных логичных рассуждений вы ТС походу удаляетесь в теорию вероятности, а если точнее вы собираетесь тыкать пальцем в небо пока как минимум 140 раз но это еще не придел. Этак вам ни какой мощности компьютора может не хватить. А уж нам в практическом применении это вообще не к чему никто не будет ииследовать 140 параметров при отборе доноров - это факт, даже если они и окажутся верными, а тут еще большой вопрос что с параметрами вы попали в точку.
Но все равно тема хорошая определенные моменты вашей теории мне понравились и я их взял на вооружение.

Я хочу попытаться интерполировать. Вдруг получится. ;)

Просто делать столь массовые запросы опасно (прикроет Яндекс это). Пока есть возможность сравнивать с эталонами буду это делать.

devzev добавил 18.01.2009 в 21:14

dmbav:
Ну как Вы тут всех в википедию отправляете, так и я Вас отправлю :)

Просто Вы сравнили свой метод с сеопультом, поставив в сравнение два понятия, которые заведомо не сравниваемые, а просто напросто означают разные вещи.

Может быть Вы просто что-то другое хотели сказать, но я мысли, к сожалению, читать не умею.

dmbav добавил 18.01.2009 в 21:11

Ну как Вы тут всех в википедию отправляете, так и я Вас отправлю :)

Просто Вы сравнили свой метод с сеопультом, поставив в сравнение два понятия, которые заведомо не сравниваемые, а просто напросто означают разные вещи.

Может быть Вы просто что-то другое хотели сказать, но я мысли, к сожалению, читать не умею.

Вы тут про сеопульт? :) Я просто не понял сразу. Пардон.

Не спорю, что 2 этих варианта сравнивать невозможно. Но можно будет сравнить эффективность, т.е. выхлоп. А это, как мне кажется, самое важное.

Egorofff:
Теперь понятно, что Вы сравниваете с эталонными сайтами по 140 параметрам при измерении траста (вероятности трастовости сайта).
А как дело обстоит с запросом, который Вам приснился? он показывает какой сайт, скажем из двух, более трастовый?

Да. Всё сравнение происходит с эталонами. Пробую всё коррелировать для уменьшение погрешности.

На вопрос в топике уже отвечал где-то.

И ещё, любителям покритиковать: я люблю критику и всегда воспринимаю её положительно. Ибо часто она показывает на погрешности и ошибки.

В личке вроде ответил всем. Там был просто шквал вопросов, но отписался каждому.

Если у кого-то будут идеи о том, на что ещё и как проверить - с удовольствием выслушаю.

Немного разгребусь, соберу всё в кучу и напишу статью.

dmbav:
Че-то я не понял, как можно сравнивать два понятия, лежащие в разных плоскостях? :)

Случайная величина может быть вполне как дискретной функцией (самое элементарное - бросание кубика с 6 гранями), так и непрерывной.

devzev, может быть не стоит писать на форуме в выходные дни, когда мозг расслаблен? ;)

А где вы нашли разные плоскости? Сравнение попарное (ну или многогранное) при каждом "событии".

А для уточнения их можно коррелировать. :)

Короче, тут спорить бесполезно. Нужно тупо попробовать.

Утка-робот:
Как минимум, один из этих пяти. Вероятность соответственно от 20% (если один) до 100 (если все). Вероятность попасть в трастовый донор, если тыкнуть в него пальцем будет такая:
P=(0.2+0.4+0.6+0.8+1)/5=0.6 или 60% Это при условии, что хотябы один такой там есть.
По-моему, это самый полезный вывод из задачи :-)

Что-то вы тут совсем о другом.

Вы не учли, что мы не присваиваем событию какого-либо конкретного значения. Они нормируются после получения всех результатов.

devzev добавил 18.01.2009 в 19:45

Утка-робот:

Читал всю тему, и после того, как из чисел 30 и 20 было получено 5% (путем деления 1 на 20), траст к ТС заметно понизился.

Уже признался там в своей невнимательности и извинился. Считаю, что каждый имеет право на ошибку.

permyak:
devzev, хм..а я на сеопульт особо не обращал внимания..спасибо, терь обращу) 37 конечно меньше, чем 140, но лучше, чем на "глазок" )))

А там фильтры так же взяты "на глазок". Не обольщайтесь. ;)

devzev добавил 18.01.2009 в 19:03

stabuev:
Вот уж чего не знаю, того не знаю 😂 в любом случае, могу лишь пожелать Вам удачи.

Вот я хочу это проверить. Но модель может выстрелить.

Не люблю топтаться на месте! ;)

stabuev:
Идею я понял давно, по косвенным факторам определить как себя ведут трастовые сайты, и подбирать сайты с таким поведением пытаясь максимизировать вероятность попадания в траст ;).

душа лежит к меньшему числу ссылок :) при равном числе страниц на сайтах

Поняли идею? Таких параметров только я один придумал 140 уже. Далее все сайты после каждого этапа заносятся в единую таблицу и нормируются по вероятности.

После n этапов получаем вероятностную матрицу. В ней посчитаем аналог центральной оси и окна (чтобы попытаться отбросить погрешности, ибо нам интересно только нормальное максимально-равномерное распределение для более быстрой сходимости с эталоном)

В итоге будем иметь такую табличку:

сайт1 с вероятностью 88% хороший донор

сайт2 с вероятностью 54% хороший донор

сайт3 с вероятностью 34% хороший донор

сайт4 с вероятностью 23% хороший донор

А теперь скажите мне: что даст более точный результат? 37 фильтров пульта, или мой метод?

Хорошо. Получили вероятность a1, что первый сайт хороший донор. И b1, что второй хороший. a1>b1

Следующий вопрос:

Исследуемые прежние. ТИЦ=20 у обоих.

С одного идёт 50 исходящих ссылок, с другого 20. Имею ввиду всего с сайта.

У кого по Вашему мнению больше вероятность того, что он более трастовый?

ВНИМАНИЕ!!! Про предыдущие вопросы забудьте! Вам известно только то, что я дал в этом вопросе!

Str256:
Наверно это субьективный показатель. Внутренние страницы продвигаются по СЧ и НЧ, либо на них ссылаются, так как там есть интересная информация. Поэтому в среднем - 2-й сайт будет более полезным для пользователя, чем тот на котором продвигается только морда. Число маркёров грубо можно считать равным числу страниц с PR>0. Так и быстрее прикинуть можно.

stabuev, уже наверняка понял к чему я задаю ему такие вопросы (он парень не глупый). :) Я только жду на каком по счёту вопросе он поймёт идею.

devzev добавил 18.01.2009 в 18:45

stabuev:
вот здесь не знаю, на одном может быть всего 2000 страниц, на другом всего 30 :).

С ТОЧКИ ЗРЕНИЯ ВЕРОЯТНОСТИ!!! К ЧЕМУ БОЛЬШЕ ДУША ЛЕЖИТ? Отключите свои выводы из практики!

General:
Если правильно понял ТС то траст в его понимании это относительная величина. Маркеры и нужны для того чтобы попробовать привязать сайт к трастовости (точнее это будет только один из элементов формулы), попробовать найти некоторую зависимость (я пишу от своего лица, ТС видимо все это уже нашел).

Почти. Проблема пульта в том, что он оперирует дискретными функциями!

В моём случае, исследование поведения и работа с случайными величинами даст на порядок бОльший результат при формировании white и black листов.

Всего: 2682