Анализатор документов

L
На сайте с 15.11.2000
Offline
2
Leo
12729

Буду страшно признателен, если кто-нибудь поможет найти программу (не сервис), которая:

1) создаёт список слов, встречающихся в документе с указанием их частоты;

2) понимает кириллицу (пофиг, что не различает словоформы);

3) понимает в качестве входящего параметра не только место размещения документа на диске, но и его веб-адрес.

Встречал программы, удовлетворяющие одному-двум пунктам. И вроде бы кажется такая малость - ан нет!

До зарезу нужно.

L
На сайте с 15.11.2000
Offline
2
Leo
#1

Неужели такой сложный вопрос?

AiK
На сайте с 27.10.2000
Offline
257
AiK
#2

Originally posted by Leo:
Неужели такой сложный вопрос?

Не сложный. Только искать в лом. Ты же сам представляешь, как поисковики спамят

Но если ты найдёшь человек десять желающих (чтобы потешить моё самолюбие ) то я берусь написать такую программу.

E
На сайте с 24.10.2000
Offline
111
#3

Второй нашелся

F
На сайте с 15.11.2000
Offline
116
#4

Originally posted by AiK:
Но если ты найдёшь человек десять желающих (чтобы потешить моё самолюбие ) то я берусь написать такую программу.

Я третий желающий + человек 70 студентов, которым я читаю лекции и могу порекомендовать твою программу.

[This message has been edited by funsad (edited 21-11-2000).]

[Удален]
#5

Я 74-й желающий учитывая студентов funsad'а

AiK
На сайте с 27.10.2000
Offline
257
AiK
#6

Шутки - шутками, а бета-версию можете забрать со страницы, указанной в профайле. Раздел проекты. Условия для выхода последующих версий - там же.

CU,

AiK

F
На сайте с 15.11.2000
Offline
116
#7

Originally posted by AiK:
Шутки - шутками, а бета-версию можете забрать со страницы, указанной в профайле. Раздел проекты. Условия для выхода последующих версий - там же.

Как же, как же -- не microsoft-ом единым жив программист. ;-) http://about.al.ru/ubb/Forum10/HTML/000001.html

AiK
На сайте с 27.10.2000
Offline
257
AiK
#8

Добавил обработку тэгов и поддержку кодировок KOI и DOS

L
На сайте с 15.11.2000
Offline
2
Leo
#9

AiK, я просто в восторге!

То что есть + загрузка с http - и мои мечты сбылись.

На тему того, как много проблем с морфологией есть хорошая статья на http://www.osp.ru/school/2000/01/012.htm

(кстати, у журнала название прикольное).

Если кто-то приблизится к тому, чтобы и эту проблему побороть - почёт тому и слава.

А пока спасибо и на этом.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#10

Классная статья.

Вот маленькая цитата

Обычно полноценный словарь для русского языка должен включать не менее 100-120 тысяч основ слов, а таблицы окончаний – не менее нескольких сотен наборов эквивалентных окончаний.

Такой словарь мне в одно жало не составить.

Кстати, пользуясь случаем хочу спросить у автора, какая "первая" форма глагола "трусь"?

З.Ы: наверно идеальная поисковая система должна ещё и слэнг всяческий учитывать.

Неужели можно надеяться, что Рамблер осилит большую часть написанного?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий