Поиск похожего контента в пределах заданной погрешности

_savit
На сайте с 19.03.2006
Offline
135
527

Всем привет.

В мускуле есть таблица с 2мя текcтовыми столбцами

title char(100) # заголовок объявления

content varchar(3000) # текст объявления

Задача: найти похожие объявления в пределах заданной погрешности.

Смысл: при постинге юзером нового объявления, модератор должен знать что такое объявление уже есть на сайте ( например с похожестью 90% ... само число не нужно, нужно чтобы предел похожести можно было задать)

Интересует прежде всего алгоритм определения похожести. Может кто уже курил эту тему?

Впринципе можно заюзать полнотекстный поиск мускула для вычисления релевантности. Но может есть другие интересные идеи на этот счет?

https://vk-botovod.ru - комбайн ВКонтакте, мультимессенджер, эмулятор жизни аккаунтов

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий