- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Посмотрите функцию DpsStrHash32 в DataparkSearch.
Задача - из любого слова получить 4-байтное слово (другими словами уникальное для слова число) методом хэширования (необратимое тоже подойдет :))
Есть такой зверь perfect hash function но как я помню это для заранее известного не слишком большого набора слов.
Пошла качать и перечитывать Кнута. Там, вроде, в 3-м томе, если ничего не путаю, есть описание похожего...
А где это уже Кнут так лежит чтобы можно было скачать? Если можно то лучше приватным посланием.
Так в шаре.
ed2k://|file|Donald_E_Knuth.The_Art_of_Computer_Programming_Vol._3.Sorting_and_Searching.preliminary.pdf|67555733|1CD9F41948C846C0C58546A34E169C6C|/
Joy,
Вообще-то я имела в виду IRC. Только что-то у тех ботов на DCC очень большие очереди. Я ждать задолбалась... а может, это мой клиент глючит...
А о каком размере ключа идет речь?
Ken, О размере ключа речь не идет :)
Речь идет о размере хэша и его уникальности.
Почитала тут всякие весчи :) Действительно, гарантии исключения коллизий не дает ни одна хэш-функция. Что плохо...
А надо подлиннее взять... не 4 байта, а 16!
Смысл? В 16 байт и само слово влезет.
Мне кажется, идеальным решением было бы хеширование первых N символов слова по какому-то алгоритму, предполагая, что там все пространство забито словами плотно.
Остальные символы (кроме N) - искать уже с использованием древоподобной структуры.
Interitus,
16-байтный id-шник - это здорово... :)
Древовидная структура - у того же Коваленко в его анализаторе. Но дело в том, что у него это дерево основано на словаре, а нам придется устраивать перечет всех возможных буквосочетаний. Или я ошибаюсь?