Скрипт извлечения ключевых фраз из текста

12
deleon
На сайте с 16.09.2004
Offline
173
#11
apru:
Попробовал. Не очень то понятно.

Что непонятного? :)

Берем текст (html-исходник, URL) и получаем список фразы, наиболее характеризующие этот текст. Далее эти фразы можно употреблять как душе угодно, хоть title из них составляй, хоть keywords.

А ссылка, которую я дал - это лишь пример сервиса, построенного на моем скрипте.

MiRaj
На сайте с 03.07.2006
Offline
509
#12

deleon, попробуйте сравнить результаты вашего скрипта с этими

http://miralab.ru/tools/service/#plotnost

особенно с первым в разделе

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
deleon
На сайте с 16.09.2004
Offline
173
#13
MiRaj:
deleon, попробуйте сравнить результаты вашего скрипта с этими
http://miralab.ru/tools/service/#plotnost
особенно с первым в разделе

Я не увидел там фраз, только слова... К тому же там в список включены все стоп-слова, что не есть правильно...

MiRaj
На сайте с 03.07.2006
Offline
509
#14

deleon, меня больше интересует разбежность в результатах по однословным ключам.

deleon
На сайте с 16.09.2004
Offline
173
#15
MiRaj:
deleon, меня больше интересует разбежность в результатах по однословным ключам.

Я же не знаю их алгоритм извлечения контента. У меня анализируется только контент заключенный между тегами <body>...</body> (есть вариант анализа всей страницы с title и мета-тегами). Может у них не анализируется содержимое alt, может не включается noindex-контент. Так что тут речь не про неправильность работы скрипта, а про идентичность анализируемого материала.

MiRaj
На сайте с 03.07.2006
Offline
509
#16
deleon:
Так что тут речь не про неправильность работы скрипта, а про идентичность анализируемого материала.

Именно.

Т.е. нужно либо определиться что индексировать, либо выдать пользователю дюжину галочек для настройки :)

deleon
На сайте с 16.09.2004
Offline
173
#17
MiRaj:
Именно.
Т.е. нужно либо определиться что индексировать, либо выдать пользователю дюжину галочек для настройки :)

Полностью согласен, для online сервиса, это необходимо. Похоже придется написать полноценный сервис для демонстрации работы скрипта :)

tyumile
На сайте с 27.07.2005
Offline
138
#18

1. Или я ничего не понимаю, или у меня не работает... ввожу урл в виде http://www.site.ru/ - показал только одну фразу, которая там встречается только 1 раз.

2. С utf-8 не будет проблем?

deleon
На сайте с 16.09.2004
Offline
173
#19
tyumile:
1. Или я ничего не понимаю, или у меня не работает... ввожу урл в виде http://www.site.ru/ - показал только одну фразу, которая там встречается только 1 раз.
2. С utf-8 не будет проблем?

Если можно, сайт в личку. Погоняю :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий