Скрипт выделения ключевых слов

DeveloperRu
На сайте с 27.02.2009
Offline
72
1254

на чем работает этот скрипт http://diff.biz.ua/keywords.php ?

хочу так же средствами пхп автоматически выделять ключевые слова в новости и заносить их в БД

Ответы на вопросы (http://telenok.com)
VX
На сайте с 04.02.2009
Offline
32
VdX
#1

1. Разбиваем весть текст на слова (заносим слова в массив)

2. Считаем общее кол-во слов

3. Далле в значение ассоциативного массива (где ключ каждое слово) занисим кол-во его повторений ($arr[$word]=$count). Повторения ищем простым перебором и сравнением на полное или частичное (выделяя часть слова substr) совпадение.

4. Считаем плотность каждого слова. Это отношение кол-ва повторов слова к общему кол-ву слов (п.2)

5. Выбираем n-наибольших слов по плотности. Они для данного текста ключевые

DeveloperRu
На сайте с 27.02.2009
Offline
72
#2

спасибо☝ но там плюс ко всему, слова приведены в нормальную форму

я, конечно, могу воспользоваться phpMorphy, однако, возможно, кто-то уже делал подобное

VX
На сайте с 04.02.2009
Offline
32
VdX
#3

Можно в конце слова всегда гласные удалять. Будет близко к НФ и без словарей

VX
На сайте с 04.02.2009
Offline
32
VdX
#4

Да, чуть не забыл. Нужно ещё условия на длинну слова скажем более 3-х символов, а то предлоги повылезают

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий