Хэширование слов

Z
На сайте с 03.01.2004
Offline
32
#11

Посмотрите функцию DpsStrHash32 в DataparkSearch.

J
На сайте с 22.08.2004
Offline
8
Joy
#12
Как писал lagif
Задача - из любого слова получить 4-байтное слово (другими словами уникальное для слова число) методом хэширования (необратимое тоже подойдет :))

Есть такой зверь perfect hash function но как я помню это для заранее известного не слишком большого набора слов.

Как писал lagif
Пошла качать и перечитывать Кнута. Там, вроде, в 3-м томе, если ничего не путаю, есть описание похожего...

А где это уже Кнут так лежит чтобы можно было скачать? Если можно то лучше приватным посланием.

lagif
На сайте с 15.12.2004
Offline
30
#14

Joy,

Вообще-то я имела в виду IRC. Только что-то у тех ботов на DCC очень большие очереди. Я ждать задолбалась... а может, это мой клиент глючит...

Это тоже пройдет...
K
На сайте с 22.04.2003
Offline
31
Ken
#15

А о каком размере ключа идет речь?

lagif
На сайте с 15.12.2004
Offline
30
#16

Ken, О размере ключа речь не идет :)

Речь идет о размере хэша и его уникальности.

Почитала тут всякие весчи :) Действительно, гарантии исключения коллизий не дает ни одна хэш-функция. Что плохо...

[Удален]
#17

А надо подлиннее взять... не 4 байта, а 16!

AA
На сайте с 16.04.2001
Offline
70
#18

Смысл? В 16 байт и само слово влезет.

С уважением, Антонов Александр.
euhenio
На сайте с 21.09.2001
Offline
357
#19

Мне кажется, идеальным решением было бы хеширование первых N символов слова по какому-то алгоритму, предполагая, что там все пространство забито словами плотно.

Остальные символы (кроме N) - искать уже с использованием древоподобной структуры.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
lagif
На сайте с 15.12.2004
Offline
30
#20

Interitus,

16-байтный id-шник - это здорово... :)

Древовидная структура - у того же Коваленко в его анализаторе. Но дело в том, что у него это дерево основано на словаре, а нам придется устраивать перечет всех возможных буквосочетаний. Или я ошибаюсь?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий