- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Сделать зеркальное отображение картинки :)
Выше уже написали, что зеркальное отображение сечется "на ура", читайте внимательнее. Да и по логике, самое элементарное для Яши это проверить зеркальные отображения вместе с шинглами и пр.
У кого есть образец поиска по Яндекс картинкам, с вариантом повёрнутой картинки?
А почему бы яндексу алгоритмом не сделать варианты катинки - оригинал, зеркальный, перевороты и повороты поградусно, и с ними тоже сравнивать? Или это нагрузит сервера?
У меня яндекс определяет дупликаты в случае если фотка с водяным знаком (большие полупрозрачные буквы на всю картинку) и без.
Вот
Конечно, скоро выдача будет несколько иной. Но пример показывает, что Я узнает рамку и разные подписи.
Уменьшаем битность, вычисляем взвешенную последовательность цветов (по горизонтали или вертикали, а где нет быстрой смены цветов в перпендикулярной плоскости, пишем в базу как хеш-код), например, 0.3 синих -- 0.3 черных -- 0.2 зеленых -- 0.2 синих == 1 линия. И так несколько линий.
Если с очередной картинки полученное множество весов является подмножеством уже занесенного в базу (и наоборот), то это вероятно дубль. Чем больше совпадений множеств, тем вероятнее, что это дубль.
Вот
Конечно, скоро выдача будет несколько иной. Но пример показывает, что Я узнает рамку и разные подписи.
Где вы там рамку увидели? :) Если уж делать рамку, то толстую. Иначе всё бессмысленно.
Где вы там рамку увидели? :) Если уж делать рамку, то толстую. Иначе всё бессмысленно.
тут: http://6494876.ru/images/fotowall/nature%20099.jpg
Рамка не влияет. Если только размытая и по ширине в половину изображения.
тут: http://6494876.ru/images/fotowall/nature%20099.jpg
Рамка не влияет. Если только размытая и по ширине в половину изображения.
Не в половину. 10% будет достаточно.
ТС, просто интересно, с какой целью интересуетесь?
По теме: есть несколько способов определения т.н. "нечетких дубликатов". Под "нечетким дубликатом" я понимаю то что если взять фотку, изменить ей разрешение, немножко обрезать по краям, наложить пару водяных знаков, изменить формат с gif на jpg - то файл по структуре изменится на 100%, но визуально человек видит что это одна и та же фотка. Именно поэтому, как тут писали выше, Яндекс определяет дубликат и с водяными знаками, и с прочими преобразованиями.
Про "рамки", "зеркальное отражение" и т.д. - попробуйте реализовать сами - и поймете что "нечеткие дубликаты" такими способами не отыскать.
Как это делает конкретно Яндекс - знает только сам Яндекс. Но сами технологии - давно уже не секрет, нужно только погуглить.
P.S. В свое время мне приходила идея сделать что то типа поисковика по картинкам. Т.е. не как у Яндекса - введи ключевое слово - получи результат, а загрузи оригинал - и найди все копии или похожие картинки. Но че то не нашел в этой идее ничего коммерчески-привлекательного, хотя как сделать - примерно представляю.
исключительно по коду..
Bebs, а Вы не читали темку примерно месяц назад, если не ошибаюсь dadot создавал, он показывал очень интересный пример изображения (ноты) который Яндекс посчитал дубликатом, что здесь скажете по Вашей теории "исключительно по коду" или это как подбор коллизии при бруте md5 ?