Sveta-777

Рейтинг
0
Регистрация
27.02.2011

Здравствуйте, спасибо автору за интересную программу. Но у меня проблемка.

Программа - последней версии 1.0.9.50 - выдаёт очень большой процент идентичных текстов, при любых настройках, даже когда ставлю шингл минимальный - 3, процент схожести - 1 процент. Устанавливаю - получить 1000 текстов, то есть с заведомым превышением теоретического количества вариантов комбинаций,чтобы узнать максимальное возможное количество разных комбинаций при разном проценте схожести, но программа всегда выдаёт 1000, с огромным повтором одинаковых текстов. Что сделать, чтобы программа не выдалавла совершенно идентичные , У меня, правда, тексты были в одно предложение -15-20 слов.

Сравнение получившихся текстов не делала, потому что не поняла как это делать, может быть- после этой процедуры можно удалять одинаковые .

Читала в форуме, что были проблемы противоположные - то есть программа выдалавала мало текстов и приходилось увеличивать шинглы и процент схожести, чтобы увеличить количество текстов в выдаче. Подскажите, пожалуйста, как решается проблема большого количества повторов, чтобы их не было совсем, пусть выдаёт мало текстов, но не одинаковых, чтобы понять, сколько неодинаковых получается при каких настройках.

Очень прошу ответить. Спасибо. ;)

С уважением. Света.