Интернет-математика 2009

[Удален]

12 марта 2009, 19:48

1274

Яндекс проводит конкурс, основная задача которой - получение функции ранжирования документов на основе обучающего множества.

http://company.yandex.ru/grant/2009/

Окончание конкурса - 15 мая 2009 года

Кто нибудь принял участие в этом конкурсе?

Меня интересует несколько вопросов:

1. Как происходит оценка результата? Почему, если я отдаю Яндексу файл с различными значениями (сперва с всеми значениями равным 0, а потом со значениями равным 4) - мой результат не меняется. Я не понял формулу оценки результата.

Кто нибудь может ее подробней разъяснить? Желательно на примере.

2. Написано, что "Файл с обучающей выборкой содержит оценку релевантности, значения из множества {4, 3, 2, 1, 0} (4 – «высокая релевантность», 0 – «нерелевантно»). ".

Я так понимаю, что различных значений может быть только 5 - {4, 3, 2, 1, 0}.

Тем не менее - в файле imat2009_learning.txt - есть строчки с релевантностью отличной от этих чисел (например строка 97287 - релевантность 0.5).

Вот и не понятно, в результате, в полученном файле - может быть релевантность - дробное число?

352

SaleSeo

12 марта 2009, 20:19

#1

Вы взорвали мозг, пойдем изучать)

Может есть у них поддержка уже, спросить там и здесь процитировать.

Прогон BULLET для крауд,PNB,зеркал,доров https://bootmasterru.com/postingbyxrumer.html | Честное SEO,настройка Я Директ,семантика и оптимизация под ключ https://saleseo.ru :)

65

xant

12 марта 2009, 21:04

#2

suharik:
Вот и не понятно, в результате, в полученном файле - может быть релевантность - дробное число?

Релевантность проставляли люди. Скорее всего, для этой строки два разных человека поставили две разные оценки (0 и 1).

Вообще, я вчера покрутил их задания. Хотя там всё нормализовано, опознать кое-какие параметры можно... Вот только толку от этого чуть, в плане "выведать у яндекса какие-нибудь фишки" конкурс ничего не даст.

Суть в том, что яндекс ищет себе готовые молодые мозги, вот и всё.

Эксклюзивные сайты и веб-2.0 приложения под ключ. Дорого.

Упал трафик в Яндекс Нарушение требований к запросам В Finteza появилась скорость

[Удален]

12 марта 2009, 21:10

#3

xant:
Релевантность проставляли люди. Скорее всего, для этой строки два разных человека поставили две разные оценки (0 и 1).

Меня интересует - могу ли я в своей версии файла с ответами - использовать дробные числа?

D

24

denplusplus

12 марта 2009, 23:24

#4

Можете. Документы по каждому запросу будут отсортированы по проставленной вами оценке. Например, результат не изменится от умножения результирующих оценок на любую положительную константу.

[Удален]

13 марта 2009, 10:57

#5

Интересно, а при помощи алгоритмов Яндекса - какой результат получится?

P

48

pavelp

19 марта 2009, 22:23

#6

интересно почему в тестовом наборе некоторые строки начинаются с "-1" они должны просто состоять из пар признак:значение... а на камент после знака # можно не обращаить внимания это чисто идентификатор запроса, чисто справочное значение

Упал доход Яндекс кобласит Проблема с безанкорными ссылками?

Open AI тестирует память для ChatGPT

Зачем быть уникальным в мире, где все можно скопировать