tano

Рейтинг
2
Регистрация
28.11.2005
Keva:
Ну что ж, тут как в анекдоте :) Пройдись по базару, посмотри, может, где дешевле :)

сам сделаю, в общем уже понятно как оно должно работать

Keva:
За 3000 сделаю... За меньше лениво...

За proof of concept "тривиального" алгоритма - дорого.

AlexA:
В данном случае подойдет простой словарь словоформ без всяких "заточенных под язык" методов (любое дерево здесь подойдет). Вот тогда получение диапазона для шаблона превращается в тривиальную задачу.

тривиальную..

Дам $500 за реализацию такого алгоритма.

На любом языке, не обязательно си, но чтобы запустить проверить можно было, перл, питон или джава подойдут.

Нужен быстрый поиск с wildcards по словарю из примерно 100-150 миллионов слов.

Набор символов [\x21-\xFF], максимальная длина слова 128 байт, на разбивку на более простые и короткие слова по каким-то границам внутри слова (пробелы,запятые,...) расчитывать не стоит.

Найти нужно все слова в словаре, подходящие под шаблон, желательно (но не обязательно) в отсортированном порядке.

В словарь могут добавляться слова, удаляться не могут - нужно апдейтить индекс без перестройки его с нуля по всему словарю.

Размер индекса критичен, желательно уложиться не более чем еще один размер словаря, время создания индекса - не очень критично.

Очень критично - время поиска и "время поиска первых n результатов подходящих под шаблон"

12
Всего: 13