- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Например, доска объявлений, куда грузят картинки. Объявления повторяются, фото тоже.
Можно создать БД хешей картинок и одинаковые картинки в объявлении не загружать.
Экономим место на диске.
Вопрос - как средствами php быстро проверить уникальность картинки?
Можно попробовать случайную выборку пикселей на изображении и записывать цвет в базу.
Вопрос - как средствами php быстро проверить уникальность картинки?
Всё тем же хешем и сравнением md5_file()/sha1_file() от файла с хэшем изображения в базе.
md5, пусть с малой, но вероятностью, может совпадать у разных картинок. Или не так?
md5, пусть с малой, но вероятностью, может совпадать у разных картинок. Или не так?
Коллизии бывают, но редко. Можете брать два хэша (md5 и sha1) и сравнивать сразу по двум.
Каким образом у Вас совпадут md5()?
Если совпал с картинкой, то эта таже картинка и не стоит её дублировать, и отправляем её в temp на всякий пожарный, на сутки например, мало ли.
Вот и все.
Каким образом у Вас совпадут md5()?
Аффтар, погугли про коллизии. Прошарься, штоле.
StM7, Вы хоть раз видели МД5 хеш в глаза? Или думаете что из 32 байт можно сделать бесконечное число комбинаций?
StM7, Вы хоть раз видели МД5 хеш в глаза? Или думаете что из 32 байт можно сделать бесконечное число комбинаций?
Я! Я видел хеш MD5!!
Коллизии, теоретически бывают, но практически, даже если ТС будет их загружать на сайт ежесекундным потоком всю свою жизнь, он на них не нарвётся, и дети его не нарвутся, и внуки.
Кстати, как-то слушал доклад яндексоида - одного из авторов Я.диска: они на всяких случай подстраховались и для каждого файла хранят два хеша md5 (с солью и без). Ну так за все время существования диска с его многими петабайтами информации, ни одной коллизии на единичном хеше не наблюдали 🙄
если льют много идентичных бинарно картинок - то md5 или sha решит вашу задачу, если вам нужен поиск сходства по визуальным критериям, то обратите внимание на phash... все зависит от специфики того, что заливают и насколько критичны погрешности (залили фотку с вотермарками или ресайзили её)
пару лет у нас на одном из проектов работает проверка на уникальность по md5 , специфика там позволяет именно таким способом решать задачу - работает и работает, никто не жалуется и все довольны.. в другом проекте сейчас начинаем работу по поиску визуальных сходств, там все намного интереснее и веселее...
Яндекс на своем диске не обнаружил коллизии.
На яке рассказывали.
так что это погрешность, на которую можно забить.