Анализатор документов

N
На сайте с 20.07.2001
Offline
3
#61

Привет Aik

пасиба за помощь

должен был перезаписать.

<font face="Verdana" size="2">

-именно перезаписал

</font>

btw, в последней версии объект result.db...

..Найди в регистри ключ

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Xbase\win32

должен указывать на %windir%\System32\msxbde40.dll

Распакуй PAN и запусти его по-человечески.



-с ключём всё в порядке;распаковал по человечески:
выдаёт ошибку, и опять page_result.
Не знаю прямо..
А что, только у меня траблы с использованием?



с уважением, njnj
N
На сайте с 16.05.2001
Offline
6
nix
#62

А что, только у меня траблы с использованием?

U mena tozhe, no ya, reshaya "ne ponizhat' urovna znanii forumistov", ne sprashivaiu, zhdu's voprosov ot drugih...

nix
AiK
На сайте с 27.10.2000
Offline
257
AiK
#63

Траблы были, но после того, как установил какой dll не хватает, всё стало хорошо.

Попробуй закачать SP5 для Jet 4.0. - должно помочь.

B
На сайте с 23.03.2001
Offline
3
#64

Та же проблема с page_result.

WIN98, Jet 4.0 есть, Jet 4.0 SP5 поставлен

При нажатии на Calc выдает:

"Объект 'page_result' не найден ядром базы данных Microsoft Jet ..."

При этом файлик page_result.dbf аккуратненько кладется в директорию с pan.exe

AiK
На сайте с 27.10.2000
Offline
257
AiK
#65

Хм. Получается, я старую версию положил...

В последней версии таблица переименована в result.dbf, т.к. у мыкрософтовского драйвера траблы с длинными именами, он берёт только формат 8.3.

Сейчас по новой залью.

VT
На сайте с 27.01.2001
Offline
130
#66

<font face="Verdana" size="2">Originally posted by AiK:
Хм. Получается, я старую версию положил...
В последней версии таблица переименована в result.dbf, т.к. у мыкрософтовского драйвера траблы с длинными именами, он берёт только формат 8.3.
Сейчас по новой залью.
</font>

AIK, у тебя интересная программка. Чтобы ты еще хотел в ней видеть?

AiK
На сайте с 27.10.2000
Offline
257
AiK
#67

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:
AIK, у тебя интересная программка. Чтобы ты еще хотел в ней видеть?
</font>

Что-то не понял я вопроса? Это предложение своих услуг по развитию программы или вопрос о том, что будет в неё добавлено?

Если последнее - то Александр Садовский предложил много чего полезного (частью на этом форуме, частью на моём), и именно в этом направлении прога и будет развиваться.

B
На сайте с 23.03.2001
Offline
3
#68

<font face="Verdana" size="2">Originally posted by AiK:
Сейчас по новой залью.</font>

Спасибо, теперь все Ок.

E
На сайте с 14.11.2001
Offline
1
E
#69

Функция построения словника (списка всех слов в поискового массива) есть в бесплатной версии Yandex.Site. Естественно, с учетом словоформ. Скачать ее можно здесь:

http://company.yandex.ru/ysitefree/

Да, законы, которые тут упоминались, правильльно называются: закон Ципфа и закон Брэдфорда.

Ashmanov
На сайте с 21.11.2000
Offline
66
#70

<font face="Verdana" size="2">Originally posted by AiK:
Классная статья.
Вот маленькая цитата
Обычно полноценный словарь для русского языка должен включать не менее 100-120 тысяч основ слов, а таблицы окончаний – не менее нескольких сотен наборов эквивалентных окончаний.
Такой словарь мне в одно жало не составить.
Кстати, пользуясь случаем хочу спросить у автора, какая "первая" форма глагола "трусь"?
Неужели можно надеяться, что Рамблер осилит большую часть написанного?
</font>

От автора статьи: правильный ответ уже дали. Трусь - одновременно форма глагла "тереться" и "трусить". В некоторых морфологиях омонимия такого рода не заложена и я сам был свидетелем зависаний программ на этом примере.

В русском при построении аккуратной машинной морфологии главная проблема, конечно, супплетивизм, то есть случаи, когда разные основы слов не имеют ни единой общей буквы в основе (сакраментальные человек/люди, ребёнок/дети и так далее). То же в немецком, только хуже (глагольные аффиксы ge-и отделяемые приставки).

Рамблер на 100% со всем описанным не справляется, да это и не нужно. Морфология там в общем работает, а главные проблемы - с обновлением индекса, и во вторую очередь с релевантностью.

Про морфологию:

Русский морфологический словарь Лебедева под Юникс/Линакс вполне доступен и бесплатен:

ftp://mch5.chem.msu.su/pub/russian/ispell/rus-ispell.tar.gz

Вот старинный (1998) список доводок:

Hа ftp-сервере помещена новая версия словарей для ispell (0.98e). Основные изменения по сравнению с предыдущей версией (0.98d):

* проведена проверка склонения всех существительных с помощью других

программ проверки правописания, исправлены практически все найденные

в словаре ошибки (неправильно склоняемые существительные;

существительные, не имеющие множественного числа)

* добавлены ключи /F, /H, /J для существительных, используемых

только в единственном числе

* сделаны добавления правил в ключи /S, /Y, /Z

* исправлены мелкие ошибки в .aff-файле

* немного переделан Makefile

* добавлены новые слова, число образуемых словоформ сейчас составляет

440 тысяч

Проблемы:

* осталось небольшое количество существительных, для которых словарь

генерит "избыточные" формы (нестандартно склоняющиеся во мн.ч. слова

типа лес &gt; леса, луг &gt; луга: возникают "лесы", "луги")

* остались проблемы с существительными, не применяемыми во

множественном числе: другие программы проверки правописания считают

их правильными. Такие слова потихоньку вылавливаются

Ближайшие планы:

* проверка других слов (прилагательных, глаголов) с помощью других

существующих программ проверки правописания

* пополнение словаря новыми словами

Не знаю, выполнил ли автор программы эти планы в далёком 1998...

Можно поискать ispell в Рамблере или Яндексе, чтобы найти описание возможностей.

[This message has been edited by Ashmanov (edited 16-11-2001).]

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий