Скрипт для определения повторяющихся фраз/слов (публикация статей)

Agnessa
На сайте с 10.10.2006
Offline
25
836

Помогите решить задачку. На сайте юзеры могу добавлять статьи, хотелось бы что-бы был скриптик который бы проанализировав стать подбирал бы ключи. Нутром чую что такое уже где-то было. А где?

Изучаем правила форума ()
BasterYC
На сайте с 30.10.2007
Offline
148
#1

если речь не о мета теге keywords, то прийдется переделать - http://www.erun.ru/archive/index.php?t-3241.html

[Удален]
#2
/* ==================================================== ##
## SEOKEYWORDS FUNCTION | CLASS API ##
## ==================================================== */
function seokeywords($contents,$symbol=5,$words=35){
$contents = @preg_replace(array("'<[\/\!]*?[^<>]*?>'si","'([\r\n])[\s]+'si","'&[a-z0-9]{1,6};'si","'( +)'si"),
array("","\\1 "," "," "),strip_tags($contents));

$rearray = array("~","!","@","#","$","%","^","&","*","(",")","_","+",
"`",'"',"№",";",":","?","-","=","|","\"","\\","/",
"[","]","{","}","'",",",".","<",">","\r\n","\n","\t");

$adjectivearray = array("ые","ое","ие","ий","ая","ый","ой","ми");


$contents = @str_replace($rearray," ",$contents);
$this->keywordcache = @explode(" ",$contents);
$rearray = array();

foreach($this->keywordcache as $word){
if(strlen($word)>=$symbol && !is_numeric($word)){
$adjective = substr($word,-2);
if(!in_array($adjective,$adjectivearray)){
$rearray[$word] = (array_key_exists($word,$rearray)) ? ($rearray[$word] + 1) : 1;
}
}
}

@arsort($rearray);
$this->keywordcache = @array_slice($rearray,0,$words);
$keywords = "";

foreach($this->keywordcache as $word=>$count){
$keywords.= ",".$word;
}

return substr($keywords,1);
}

вот функция делающая ключевые слова по содержанию

Ayavryk
На сайте с 11.10.2003
Offline
209
#3

BasterYC В предложенном решении не хватает семантического ядра запросов. Без него в ключи пойдут общеупотребительные слова, которые не сильно нужны имхо. А если брать семантическое ядро - придется добавлять учет склонений/спряжений и разнописаний. Например Путин В[ладимир] В[ладимирович] и В. Путен

Тынгыр, мынгыр, комсомол (http://erum.ru). Ехари, ехари, (жалобно) аяврик. /народная тунгусская песня/
BasterYC
На сайте с 30.10.2007
Offline
148
#4

Ayavryk, конечно передиралово не даст желаемого результата. Это была площадка для старта. :)

Agnessa
На сайте с 10.10.2006
Offline
25
#5

Спасибо! Не совсем то но за основу взять можно

SJ
На сайте с 16.03.2008
Offline
78
#6

Если кому не лениво - накидайте немного текстов - я свой автогенератор ключей/тегов тестить хочу, я вам результаты выложу, пообсуждаем.

Потом поделюсь :)

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
SJ
На сайте с 16.03.2008
Offline
78
#7

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий