Доработка функции извлечения ключевиков

BasePelleta
На сайте с 29.05.2008
Offline
120
379

Уважаемые форумчане,

прошу помочь:

оптимизировать функцию - снизить потребление функцией ресурсов. Текст обрабатываемый 1-10 к. символов;

помочь придумать настраиваемый алгоритм выбора ключевых слов

// Функция выделения ключевых слов из текста


function SearchKeywords($text,$lenkey,$kolkey)
{

$text=strtolower(strip_tags($text));//удаляем таги и все в нижний регистр

$text=strip_tags($text);

$text = str_replace("quot", "", "$text");


$excluded = array("quot", "котор", "nbsp", "ndash", " ","час", "буду" , "будет", "только", "друг",
"данн", "raquo", "laquo","может");

$text = str_replace($excluded, "", $text);

function russtrtolower($text) {
$text = strtolower($text);
$up = 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ';
$lower = 'абвгдеёжзийклмнопрстуфхцчшщъыьэюя';
$text = strtr($text, $up, $lower);
return $text;
}

$text = russtrtolower($text);

preg_match_all("/[а-яa-z0-9ё]{".$lenkey.",}+/s",$text,$word);


$return = array_count_values($word[0]);
arsort($return);
$return = array_slice($return, 0, $kolkey);
$return = array_keys($return);

return $return;
}



$kwextracted=SearchKeywords($text,5,14);

5- мин длина слова, 14 - кол-во ключевых слов

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий