Я уже ответил на несколько сотен постов и нахожусь в непонятном состоянии. Сейчас иду отдыхать уже. :)
Я не сравнивал дискретные функции с случайными величинами. Я предположил, что второй вариант эффективнее при отборе доноров.
Смотрите, имеем дискретную функцию. Её, по идее, можно приравнять к распределению дискретной случайной величины с вероятностью появления каждого из значений = 1. :D Разве не так?
Нарисуйте на кубике только единички на всех гранях... типа того.
Я хочу попытаться интерполировать. Вдруг получится. ;)
Просто делать столь массовые запросы опасно (прикроет Яндекс это). Пока есть возможность сравнивать с эталонами буду это делать.
devzev добавил 18.01.2009 в 21:14
Вы тут про сеопульт? :) Я просто не понял сразу. Пардон.
Не спорю, что 2 этих варианта сравнивать невозможно. Но можно будет сравнить эффективность, т.е. выхлоп. А это, как мне кажется, самое важное.
Да. Всё сравнение происходит с эталонами. Пробую всё коррелировать для уменьшение погрешности.
На вопрос в топике уже отвечал где-то.
И ещё, любителям покритиковать: я люблю критику и всегда воспринимаю её положительно. Ибо часто она показывает на погрешности и ошибки.
В личке вроде ответил всем. Там был просто шквал вопросов, но отписался каждому.
Если у кого-то будут идеи о том, на что ещё и как проверить - с удовольствием выслушаю.
Немного разгребусь, соберу всё в кучу и напишу статью.
А где вы нашли разные плоскости? Сравнение попарное (ну или многогранное) при каждом "событии".
А для уточнения их можно коррелировать. :)
Короче, тут спорить бесполезно. Нужно тупо попробовать.
Что-то вы тут совсем о другом.
Вы не учли, что мы не присваиваем событию какого-либо конкретного значения. Они нормируются после получения всех результатов.
devzev добавил 18.01.2009 в 19:45
Уже признался там в своей невнимательности и извинился. Считаю, что каждый имеет право на ошибку.
А там фильтры так же взяты "на глазок". Не обольщайтесь. ;)
devzev добавил 18.01.2009 в 19:03
Вот я хочу это проверить. Но модель может выстрелить.
Не люблю топтаться на месте! ;)
Поняли идею? Таких параметров только я один придумал 140 уже. Далее все сайты после каждого этапа заносятся в единую таблицу и нормируются по вероятности.
После n этапов получаем вероятностную матрицу. В ней посчитаем аналог центральной оси и окна (чтобы попытаться отбросить погрешности, ибо нам интересно только нормальное максимально-равномерное распределение для более быстрой сходимости с эталоном)
В итоге будем иметь такую табличку:
сайт1 с вероятностью 88% хороший донор
сайт2 с вероятностью 54% хороший донор
сайт3 с вероятностью 34% хороший донор
сайт4 с вероятностью 23% хороший донор
А теперь скажите мне: что даст более точный результат? 37 фильтров пульта, или мой метод?
Хорошо. Получили вероятность a1, что первый сайт хороший донор. И b1, что второй хороший. a1>b1
Следующий вопрос:
Исследуемые прежние. ТИЦ=20 у обоих.
С одного идёт 50 исходящих ссылок, с другого 20. Имею ввиду всего с сайта.
У кого по Вашему мнению больше вероятность того, что он более трастовый?
ВНИМАНИЕ!!! Про предыдущие вопросы забудьте! Вам известно только то, что я дал в этом вопросе!
stabuev, уже наверняка понял к чему я задаю ему такие вопросы (он парень не глупый). :) Я только жду на каком по счёту вопросе он поймёт идею.
devzev добавил 18.01.2009 в 18:45
С ТОЧКИ ЗРЕНИЯ ВЕРОЯТНОСТИ!!! К ЧЕМУ БОЛЬШЕ ДУША ЛЕЖИТ? Отключите свои выводы из практики!
Почти. Проблема пульта в том, что он оперирует дискретными функциями!
В моём случае, исследование поведения и работа с случайными величинами даст на порядок бОльший результат при формировании white и black листов.