Мне эта штука напоминает этикетку крема от загара. И какой-то другой еще косметики. Названия не помню. Но, видимо, косметика пользуется популярностью, потому что в память врезалось конкретно...
Гм... что-то я не совсем поняла, чем неявные идентификаторы лучше...
а насчет того, что "идентификаторы нужны только для восстановления текста из прямого индекса" - вот тут я крупно сомневаюсь. :)
Может вы того... знаков препинания бы больше ставили для разнообразия. А то мысль нечитабельна.
Об учебниках: там вообще много чего понаписано. Практика же отличается от теории во многом. А если точно - какие вообще учебники вы имеете в виду? Насчет же задачи - мне, по крайней мере, она ясна очень даже сильно. Маячит уже вторую неделю.
Artisan,
Ну так это и будут идентификаторы :)
Кстати, а вы пробовали? :/
Maxim Golubev,
Все верно. Поиск идет по т.н. "обратному индексу". Прямой хранить, наверное, придется.
Maxim Golubev, Вроде уже рассказывала. Пока все, что я делаю - проба сил, набивание шишек и прочие неприятные вещи века.
Cпасибо. Я над этим думала. Это, на мой взгляд, половинчатый выход из положения. Подумаю еще - обязательно расскажу, что придумала.
p.s. Цветок, надо полагать, к празднику. Спасибо!
В каком массиве? Тут поиск будет по слову, а это дольше, чем по идентификатору, разве нет?
И нет разницы, как искать - хоть дихотомией, хоть прямым перебором. Все равно дольше, чем в БД по ключу.
И-эхх... спасибо!
Про весну круглый год - это, конечно, неплохо, но лично мне нравится осень. И главное, чтоб желтых листьев до зимы хватало...
На первых страницах треда объяснялось зачем - чтоб при индексации не дергать какие-нибудь БД для сопоставления слову(словоформе) уникальный идентификатор. Получается гораздо быстрее, если у нас есть какая-нибудь спец-функция.
Что же до количества слов, то реально выходит, что в словаре будет храниться около 500 тыс. записей (несловарные слова, английские и русские).
AlexA,
10 тыс. - капля в море. Где вы видели такие словари? При одном только русском... если бы только десять тысяч, зачем бы было все это городить...