определение вероятности тематики докумета

1 23
L8
На сайте с 13.05.2004
Offline
83
L78
#21

Если попустить что Вы делаете поисковик для предприятия то почему бы не делать это по % содержанию ключевых слов, ведь не будет же там никто доры делать!!!! 😂

Ну а если поисковик для масс, то как ни крути, идеального алгоритма нет, всеравно "поимеют" спамеры...хотя рецепт есть.

K
На сайте с 22.04.2003
Offline
31
Ken
#22

% вхождения - это слишком простая мера - тут хотябы термины в кластер собрать.

L8
На сайте с 13.05.2004
Offline
83
L78
#23
Ken:
% вхождения - это слишком простая мера - тут хотябы термины в кластер собрать.

А смысл? Это что то из разряда: Если нет проблем - их нужно создать.

C
На сайте с 21.12.2006
Offline
22
#24

А как на счет семантики? Правда, тут обойти проблему использования словарей не получится, но, как по мне, очень даже перспективное направление.

Кстати, не подскажете, где можно найти готовый тэзарус по любому направлению, можно даже на английском языке, главное, чтобы он был в формате XML. Буду очень благодарна за подсказку

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий