Как сделать проверку хеша?

197

lutskboy

18 октября 2016, 12:37

829

Добрый день

Подскажите пожалуйста как сделать проверку хеша.

Есть такой хеш. Например

10010001111001....

всего 64 символа. они будут записываться в базу данных. строк будет много. тисяч 10.

потом после определенного действия я получаю новый хеш. и мне его нужно сверить с теми что в базе. и вывести те что больше всего близки к нему.

сравнение идет таким образом.

число х=64 (так как хеш 64 символа). дальше

первый символ хеша 1 сравниваем с первым символом хеша 2 --- и если не совпадение то х уменьшаем на 1

второй символ хеша 1 сравниваем с вторым символом хеша 2 --- и если не совпадение то х уменьшаем на 1

и т д

ето так бы мы сравнивали на php. а как ето организовать в базе данных я не знаю. брать все подряд из нее и сверять навернека это будет долго

1785

LEOnidUKG

18 октября 2016, 12:41

#1

как ето организовать в базе данных я не знаю

БД для хранения данных, а не для вычислений. Делайте на PHP.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/

197

lutskboy

18 октября 2016, 14:06

#2

придется

думал разбить этот хеш по 4 символа и записать в бд в поле с индексом FULLTEXT

а потом искать как полнотекстовый поиск. но оказалось что match against не всегда ищет числа по 4 символа.

MySQL Error! Error Number: MariaDB, storage engine и Пытаюсь загнать БД MySql

D

153

Dinozavr

18 октября 2016, 14:24

#3

вариант для извращенцев:

поставить elasticsearch, сделать индекс и на поле с хэшами поставить ngram=1

a алгоритм, который вы используете, называется "Расстояние Левенштейна"

386

dkameleon

18 октября 2016, 21:22

#4

1. хранить свои 64 бита в формате BIGINT

2. вычисления провозить через BIT_XOR + BIT_COUNT

1

Дизайн интерьера (http://balabukha.com/)

197

lutskboy

21 октября 2016, 13:36

#5

dkameleon:
1. хранить свои 64 бита в формате BIGINT
2. вычисления провозить через BIT_XOR + BIT_COUNT

Этот совет прям в точку. Вы просто гений. По больше б таких людей на форуме. И скорость прям летает.

[Удален]

21 октября 2016, 15:55

#6

Посвятите пожалуйста, в каком случае нужна проверка на схожесть хэша? Мне до сих пор была нужна только абсолютная идентичность ключей.

Ведь схожесть хэша совсем не значит схожесть контента.

197

lutskboy

22 октября 2016, 10:49

#7

imagine:
Посвятите пожалуйста, в каком случае нужна проверка на схожесть хэша? Мне до сих пор была нужна только абсолютная идентичность ключей.
Ведь схожесть хэша совсем не значит схожесть контента.

у меня это используется для сравнения изображений. есть сайт с обоями на рабочий стол. дабы не грузить одинаковые - делаю проверку схожести. использую PHasher для создания хеша. результат более менее нормальный.

можно картинке изменить качество или даже обрезать(но не слишком) и скрипт ищет похожие.

правда не всегда получается ожидаемый результат. но если с изображением не слишком поиздевались то и так очень даже ничего.

Чистка каналов на YouTube Вариации с ДЛЕ Монетизация картиночных сайтов и

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Дзен реализовал для авторов возможность вывода денег через СПБ