wladvlad

Рейтинг
84
Регистрация
16.08.2006

nutsa, пошел вон из моего топика! :)

greenwood:
очень даже та - достаточно показать реальную картину по стране с этими наркотиками
притом даже краски сгущать не надо ..скорее разбавлять придется

так покажи!

в чем дело-то?

а хрен ты чего покажешь, ага. :D

omatick:
Один из ВЧ ВК - 41млн страниц, 23к показов по директу, 400 с мелочью запросов по рамблеру.

я даже стесняюсь спросить про средне и низкочастотные запросы, при таких высокочастотниках! :)

конечно, если вы там яхты продаете или вертолеты, то снимаю шляпу.

я бы даже сказал, что нация не крестьян, а рабов. ;)

Turbo:
Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой.

На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта (даже не присутствующего в начальной выборке) выдать достаточно точный ответ (отклик, реакцию). Для измерения точности ответов определённым образом вводится функционал качества.

На конкурсе таким функционалом качества была тестовая часть списка асессоров (нам давалась без релевантности). Мы считали релевантность и отсылали Яндексу через форму. А Яндекс после отсылки там на своей стороне сравнивал наше значение с релевантностью асессоров. Чем меньше отличий тем выше в рейтинге. =)

хм, получается, что алгоритм подстраивается под какой-то результат? это как в учебнике, в конце, подглядеть ответ и потом решение задачи натаскивать на него.))))

я считаю, что в случае с ранжированием документов в выдаче это не сработает. :)

зависит от сайта-донора и уровня вложенности страницы.

я вообще не знаю что такое "машинное обучение", к сожалению.

не затруднит вас объяснить?

Turbo:
В заглавном посте первая ссылка ведет на официальный конкурс Яндекса. Там есть слова В рамках конкурса «Интернет-математика» мы распространяем реальные таблицы оценок, которые используются для подбора формулы ранжирования Яндекса. Таблицы содержат уже посчитанные и нормализованные признаки пар «запрос-документ», а также оценки релевантности, сделанные асессорами (оценщиками качества поиска) Яндекса. Таблицы не содержат оригинальных запросов и ссылок на оригинальные документы, не описана семантика признаков (признаки просто пронумерованы).

Публикаций по этой теме уйма, если что. =) Если уж вы физ.мат. то изучение начучной литературы не должно доставить трудов. Начать советую отсюда:
http://en.wikipedia.org/wiki/Support_vector_machine

тут непонятка вышла с тем, что люди не подбирают релевантные запросам сайты, а оценивают текущую выдачу.

и это момент принципиальный.

не алгоритм строится на данных таблиц, а с помощью этих таблиц оценивается работоспособность уже работающего алгоритма.

для соединения двух машин между собой нужен особый, кроссовый шнур. там другая разводка пинов.

но даже если вы его достанете или сделаете, то раздать на вторую машину инет с первой не получится. или перетыкать (хотя это не сеть, конечно) или роутер.

Всего: 6035