Как работает поиск Яндекса (ранжирование в топ)

tysson
На сайте с 03.02.2009
Offline
282
#51

Интересная тема.

Смените дизайн.....
T
На сайте с 05.04.2006
Offline
97
#52
wladvlad:
тут непонятка вышла с тем, что люди не подбирают релевантные запросам сайты, а оценивают текущую выдачу.
и это момент принципиальный.
не алгоритм строится на данных таблиц, а с помощью этих таблиц оценивается работоспособность уже работающего алгоритма.

А как сделать "машинное обучение" без начальных данных?

W
На сайте с 16.08.2006
Offline
84
#53

я вообще не знаю что такое "машинное обучение", к сожалению.

не затруднит вас объяснить?

A
На сайте с 09.10.2005
Offline
46
#54
wladvlad:
я вообще не знаю что такое "машинное обучение", к сожалению.
не затруднит вас объяснить?

Рискну предположить, это разработки в области AI.

Копать от LISP и Prolog в сторону современных наработок.

Мой партнёр создаёт бюджетные сайты и интернет-магазины (http://web-gu.ru), а я умею продвигать сайты. Дизайнер в запое.
T
На сайте с 22.05.2008
Offline
15
#55

Тема не столько интересная, сколько совершенно не понятная ни одному из обсуждающих её. Где находятся вебмастера? На серче. Давайте тогда все дружно поверим, что именно мы и являемся теми самыми пресловутыми "асессорами". Потому как именно здесь люди прекрасно понимают, что является реальным сайтом для людей, а что мусором.

Идеальная поисковая система будет учитывать наше мнение, при этом не позволяя нам влиять на формирование этого мнения.

T
На сайте с 05.04.2006
Offline
97
#56
wladvlad:
я вообще не знаю что такое "машинное обучение", к сожалению.
не затруднит вас объяснить?

Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой.

На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта (даже не присутствующего в начальной выборке) выдать достаточно точный ответ (отклик, реакцию). Для измерения точности ответов определённым образом вводится функционал качества.

На конкурсе таким функционалом качества была тестовая часть списка асессоров (нам давалась без релевантности). Мы считали релевантность и отсылали Яндексу через форму. А Яндекс после отсылки там на своей стороне сравнивал наше значение с релевантностью асессоров. Чем меньше отличий тем выше в рейтинге. =)

praide
На сайте с 20.07.2007
Offline
236
#57
totalwars:
Потому как именно здесь люди прекрасно понимают, что является реальным сайтом для людей, а что мусором.

Я понимаю, что 90% клиентских сайитов (в ТОПе) мусор. Клиентам ТОП нужен, а не СДЛ, что они и получают за бабки.

totalwars:
Давайте тогда все дружно поверим, что именно мы и являемся теми самыми пресловутыми "асессорами

Мы больше засиратели, а не чистильщики. У меня, к примеру только 1 СДЛ, да и тот не коммерческий.

"Наши летатели идут к смерти верным и скорым шагом." Антуан де Сент-Экзюпери
W
На сайте с 16.08.2006
Offline
84
#58
Turbo:
Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой.

На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта (даже не присутствующего в начальной выборке) выдать достаточно точный ответ (отклик, реакцию). Для измерения точности ответов определённым образом вводится функционал качества.

На конкурсе таким функционалом качества была тестовая часть списка асессоров (нам давалась без релевантности). Мы считали релевантность и отсылали Яндексу через форму. А Яндекс после отсылки там на своей стороне сравнивал наше значение с релевантностью асессоров. Чем меньше отличий тем выше в рейтинге. =)

хм, получается, что алгоритм подстраивается под какой-то результат? это как в учебнике, в конце, подглядеть ответ и потом решение задачи натаскивать на него.))))

я считаю, что в случае с ранжированием документов в выдаче это не сработает. :)

tysson
На сайте с 03.02.2009
Offline
282
#59
Turbo:

На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта (даже не присутствующего в начальной выборке) выдать достаточно точный ответ (отклик, реакцию). Для измерения точности ответов определённым образом вводится функционал качества.

Какое место вы заняли?

praide
На сайте с 20.07.2007
Offline
236
#60
wladvlad:
хм, получается, что алгоритм подстраивается под какой-то результат? это как в учебнике подглядеть ответ и потом решение задачи натаскивать на него.
я считаю, что в случае с ранжированием документов в выдаче это не сработает.

Работает лихо и уже достаточно давно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий