Интернет-математика 2009

[Удален]
1262

Яндекс проводит конкурс, основная задача которой - получение функции ранжирования документов на основе обучающего множества.

http://company.yandex.ru/grant/2009/

Окончание конкурса - 15 мая 2009 года

Кто нибудь принял участие в этом конкурсе?

Меня интересует несколько вопросов:

1. Как происходит оценка результата? Почему, если я отдаю Яндексу файл с различными значениями (сперва с всеми значениями равным 0, а потом со значениями равным 4) - мой результат не меняется. Я не понял формулу оценки результата.

Кто нибудь может ее подробней разъяснить? Желательно на примере.

2. Написано, что "Файл с обучающей выборкой содержит оценку релевантности, значения из множества {4, 3, 2, 1, 0} (4 – «высокая релевантность», 0 – «нерелевантно»). ".

Я так понимаю, что различных значений может быть только 5 - {4, 3, 2, 1, 0}.

Тем не менее - в файле imat2009_learning.txt - есть строчки с релевантностью отличной от этих чисел (например строка 97287 - релевантность 0.5).

Вот и не понятно, в результате, в полученном файле - может быть релевантность - дробное число?

SaleSeo
На сайте с 26.07.2007
Offline
352
#1

Вы взорвали мозг, пойдем изучать)

Может есть у них поддержка уже, спросить там и здесь процитировать.

Прогон BULLET для крауд,PNB,зеркал,доров https://bootmasterru.com/postingbyxrumer.html | Честное SEO,настройка Я Директ,семантика и оптимизация под ключ https://saleseo.ru :)
xant
На сайте с 17.12.2008
Offline
65
#2
suharik:
Вот и не понятно, в результате, в полученном файле - может быть релевантность - дробное число?

Релевантность проставляли люди. Скорее всего, для этой строки два разных человека поставили две разные оценки (0 и 1).

Вообще, я вчера покрутил их задания. Хотя там всё нормализовано, опознать кое-какие параметры можно... Вот только толку от этого чуть, в плане "выведать у яндекса какие-нибудь фишки" конкурс ничего не даст.

Суть в том, что яндекс ищет себе готовые молодые мозги, вот и всё.

Эксклюзивные сайты и веб-2.0 приложения под ключ. Дорого.
[Удален]
#3
xant:
Релевантность проставляли люди. Скорее всего, для этой строки два разных человека поставили две разные оценки (0 и 1).

Меня интересует - могу ли я в своей версии файла с ответами - использовать дробные числа?

D
На сайте с 25.07.2007
Offline
24
#4

Можете. Документы по каждому запросу будут отсортированы по проставленной вами оценке. Например, результат не изменится от умножения результирующих оценок на любую положительную константу.

[Удален]
#5

Интересно, а при помощи алгоритмов Яндекса - какой результат получится?

P
На сайте с 13.07.2007
Offline
48
#6

интересно почему в тестовом наборе некоторые строки начинаются с "-1" они должны просто состоять из пар признак:значение... а на камент после знака # можно не обращаить внимания это чисто идентификатор запроса, чисто справочное значение

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий