сравнение схожести строк и удаление не подходящих

H
На сайте с 21.12.2007
Offline
24
1001

как JavaScript решить такую задачу

есть textarea

в ней список строк

как удалить строки которые отличаются от большинства строк например на 30% и больше

!!! прядок слов, регистр, знаки препинания не важны, важно различие именно в словах, например

nice white mac
mac is nice and white
nice mac is white
grey pc is pretty good
white mac is nice

grey pc is pretty good должна быть удалена

(темы могут быть абсолютно разные)

зы - как посчитать 5 самых популярных слов в текстовом массиве ? чтобы потом выкинуть всё лишнее через регэкспы

B
На сайте с 26.12.2006
Offline
51
#1

как я думаю ты сам понимаешь, универсальной функции тут не будет😂

так что пиши функцию по обработке массива строк, перебирай строки, разбивай строку на слова, подсчитывай количество каждого слова во всем тексте,

вобщем задача не для javascript, можно конечно на js сделать но это изврат, а если текст большой, браузер зависнет или выкинет и т.п.

лучше передать решение серверу

PHP,MySQL,JavaScript,AJAX
H
На сайте с 21.12.2007
Offline
24
#2

ну ладно на php тогда сделаю

soundex и metaphone пригодятся ?

K
На сайте с 31.05.2007
Offline
31
#3
hrenoid:
ну ладно на php тогда сделаю

soundex и metaphone пригодятся ?

Думаю, да. Можно ещё использовать:


int levenshtein ( string str1, string str2 )

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий