lagif

lagif
Рейтинг
30
Регистрация
15.12.2004
Должность
Программер
Интересы
Идеи
Которая

Мне эта штука напоминает этикетку крема от загара. И какой-то другой еще косметики. Названия не помню. Но, видимо, косметика пользуется популярностью, потому что в память врезалось конкретно...

Гм... что-то я не совсем поняла, чем неявные идентификаторы лучше...

а насчет того, что "идентификаторы нужны только для восстановления текста из прямого индекса" - вот тут я крупно сомневаюсь. :)

Может вы того... знаков препинания бы больше ставили для разнообразия. А то мысль нечитабельна.

Об учебниках: там вообще много чего понаписано. Практика же отличается от теории во многом. А если точно - какие вообще учебники вы имеете в виду? Насчет же задачи - мне, по крайней мере, она ясна очень даже сильно. Маячит уже вторую неделю.

Artisan,

се зависит от точной постановки задачи, можно вообще обойтись без явных идентификаторов и вместо них использовать номера слов в массивах отдельно для каждой длины слова.

Ну так это и будут идентификаторы :)

Кстати, а вы пробовали? :/

Maxim Golubev,

Все верно. Поиск идет по т.н. "обратному индексу". Прямой хранить, наверное, придется.

Maxim Golubev, Вроде уже рассказывала. Пока все, что я делаю - проба сил, набивание шишек и прочие неприятные вещи века.

Artisan,

Cпасибо. Я над этим думала. Это, на мой взгляд, половинчатый выход из положения. Подумаю еще - обязательно расскажу, что придумала.

p.s. Цветок, надо полагать, к празднику. Спасибо!

В каком массиве? Тут поиск будет по слову, а это дольше, чем по идентификатору, разве нет?

И нет разницы, как искать - хоть дихотомией, хоть прямым перебором. Все равно дольше, чем в БД по ключу.

И-эхх... спасибо!

Про весну круглый год - это, конечно, неплохо, но лично мне нравится осень. И главное, чтоб желтых листьев до зимы хватало...

Artisan,

На первых страницах треда объяснялось зачем - чтоб при индексации не дергать какие-нибудь БД для сопоставления слову(словоформе) уникальный идентификатор. Получается гораздо быстрее, если у нас есть какая-нибудь спец-функция.

Что же до количества слов, то реально выходит, что в словаре будет храниться около 500 тыс. записей (несловарные слова, английские и русские).

AlexA,

10 тыс. - капля в море. Где вы видели такие словари? При одном только русском... если бы только десять тысяч, зачем бы было все это городить...

Всего: 745