синонимайзер под РУ, база 2,5к (часть вторая)

[Удален]
763

Топик устарел, по этой причине открываю новый

Нашлось время для данного проекта, и мы его таки доделали. Каких либо революционных новшеств сделать не получилось, самая важная веха это переход на морфологический движок. Цена будет демократичней чем ранее, такое вот решение было принято.

И по результатам тестов и эксплуатации будем собирать пожелания на доработку, которые будут реализованы.

Итак, что мне нужно:

- два пользователя предыдущей версии программы, для тестирования новой версии (сообщайтесь в личку).

- нужно мнение сообщества по следующей проблеме, база словоформ содержит больше миллиона записей по ru направлению и порядка 200 тысяч по en, т.е. базы в достаточном объёме даже по умолчанию. Соответственно клиенту они отдаются в не редактируемом бинарном формате, есть движок с помощью которого производится редактирование базы и затем компиляция в бинарный формат, компиляция ресурсоёмкий и длительный процесс (от 12 часов и выше в зависимости от размеров базы, возможно будет оптимизация, но на данный момент всё именно так).

Вопрос состоит в том есть ли интерес у рядовых пользователей к тому что бы получить инструмент позволяющий редактировать и компилировать базу, либо пользователям интересней будет получать базы как отдельный продукт за отдельную стоимость (например строительная, медицинская и т.п.), дефолтная база входит в состав поставки софта.

Оставляйте свои комментарии по этому поводу в треде.

FANTiK123
На сайте с 30.12.2008
Offline
76
#1

По мне лучше получать готовый продукт, чем еще что-то сидеть компилировать ) и разбираться с этим.

Как можно увидеть результат работы базы.

Универсальный парсер контента для создания интернет-магазинов (http://sbfactory.ru/?p=600) и не только ;)
[Удален]
#2

На ваше усмотрение, могу прогнать либо текст что предоставите, либо произвольный.

С базами понятно, я тоже больше смотрел именно в сторону предоставления баз клиентам.

Порядок цен на базы какой представляете?

FANTiK123
На сайте с 30.12.2008
Offline
76
#3

Прогоните просто пока любой текст. На счет цен ни чего не могу сказать, смотря какой результат будет. Если каждое второе слово заменитья и притом читабельно будет, это очень хорошо. Если замен меньше будет, то это думаю уже не надо ни кому, с меньшей заменой базы уже есть.

FANTiK123
На сайте с 30.12.2008
Offline
76
#4

Прогоните вложенный текст, желательно, чтоб результаты подсвечивались.

FANTiK123
На сайте с 30.12.2008
Offline
76
#5

Прогоните вложенный текст, желательно, чтоб результаты подсвечивались.

txt 79099.txt
[Удален]
#6

гут, результат закину в эту тему

вот сразу багов парочку нашел :)

скрины результатов обработки предоставленного текста

http://img80.imageshack.us/gal.php?g=94333551.jpg

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий