Форум Сайтостроение Веб-строительство

Поиск похожего контента в пределах заданной погрешности

135

_savit

24 ноября 2010, 21:05

545

Всем привет.

В мускуле есть таблица с 2мя текcтовыми столбцами

title char(100) # заголовок объявления

content varchar(3000) # текст объявления

Задача: найти похожие объявления в пределах заданной погрешности.

Смысл: при постинге юзером нового объявления, модератор должен знать что такое объявление уже есть на сайте ( например с похожестью 90% ... само число не нужно, нужно чтобы предел похожести можно было задать)

Интересует прежде всего алгоритм определения похожести. Может кто уже курил эту тему?

Впринципе можно заюзать полнотекстный поиск мускула для вычисления релевантности. Но может есть другие интересные идеи на этот счет?

https://vk-botovod.ru - комбайн ВКонтакте, мультимессенджер, эмулятор жизни аккаунтов

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Дзен реализовал для авторов возможность вывода денег через СПБ

Поиск похожего контента в пределах заданной погрешности