Софт для пакетной проверки взаимоуникальности текствоых файлов

D3
На сайте с 08.02.2009
Offline
55
335

Доброго времени. Подскажите пожалуйста программу для следующей задачи.

Необходимо сравнить большое количество текстовых файлов и найти процент взаимоуникальности по методу шинглов. К примеру есть файлы:

исходник1.txt <сравнить с> аналог1.txt

исходник2.txt <сравнить с> аналог2.txt

....

..

Также крайне желательно чтобы скрипт умел отсеивать пары текстов, не прошедших определенный процентный порог взаимоуника.

Возможно есть уже готовые решения для этих задач?

ewg777
На сайте с 04.06.2007
Offline
225
#1
cкрипт умел

Самое простое - на базе функции http://php.net/manual/en/function.similar-text.php

D3
На сайте с 08.02.2009
Offline
55
#2

А готовый продукт есть? я в пхп не силен(, к сожалению.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий