Как Яндекс определяет дубликаты картинок?

1 2345 6
dlyanachalas
На сайте с 15.09.2006
Offline
693
#31

Хватит уже бреда про код. Не по коду он определяет.

_Владимир_
На сайте с 04.06.2007
Offline
75
#32
dlyanachalas:
Хватит уже бреда про код. Не по коду он определяет.

никто же в ветке мотивированно не опроверг эту мысль, нужно было дать людям убедиться на примере ;)

черно / белая рассада seo icq: 426-714-284 (Владимир)
S
На сайте с 05.01.2010
Offline
80
#33

Будет ли пагубно сказываться размещение на своем сайте картинок дублированных с других сайтов и вообще с интернета?

Плюсоните если помог...
[Удален]
#34
Soxay:
Будет ли пагубно сказываться размещение на своем сайте картинок дублированных с других сайтов и вообще с интернета?

Да особо за это не наказывает, но вот если картинки на хорошем сайте уникальные - то и плюс в общую копилку. но а в целом про примеры наказания за дубли картинок не разу не видел, если есть у кого отрицательный опыт, отпишитесь, очень интересно и актуально

anser06
На сайте с 11.03.2006
Offline
276
#35
Для поиска дубликатов мы строим относительно компактные сигнатуры картинок, в основе которых распределение яркостей и цветов по площади изображения, а также некоторые другие признаки. Выбор данных для включения в сигнатуру зависит от самой картинки, в разных классах изображений отдельные виды сигнатур работают с переменным успехом. Сигнатуры укладываются в индексы сложной структуры для нечеткого поиска. В частично кластеризованном виде эти индексы удается загрузить в память.

С момента формулировки общего подхода до запуска в продакшн нам пришлось преодолеть большое количество практических проблем, которые разрешались разнообразными остроумными алгоритмами. Оказалось, что одной простой идеи — недостаточно.

Большинство известных алгоритмов по поиску дубликатов или похожих изображений основаны на поиске особых точек (feature extraction) на картинках или наборов статистических свойств изображений. Первый подход позволяет «выравнивать» и отождествлять изображения, полученные обрезанием, но требует почти квадратичной сложности вычисления, поэтому используется на ограниченных коллекциях, например, на выдаче поиска по одному запросу. Второй подход не дает достаточно хорошей разрешающей способности на больших коллекциях.

Отсюда: http://habrahabr.ru/company/yandex/blog/43141/

и http://clubs.ya.ru/company/replies.xml?item_no=14086

nitrat
На сайте с 27.10.2009
Offline
34
#36

Кто-нибудь знает чем можно нагенерить уникальных картинок?

samobart
На сайте с 30.01.2009
Offline
103
#37

В Paint'e можно

Распродажа лицензионных программ, игр, софта! (https://is.gd/W5aBww)
nitrat
На сайте с 27.10.2009
Offline
34
#38
samobart:
В Paint'e можно

а если их тысячи нужны?

mff
На сайте с 21.02.2008
Offline
266
mff
#39

Хидер яд юзает

A
На сайте с 02.11.2009
Offline
3
#40

Работаю с графикой давно, поэтому скажу, что, кроме как по коду - фиг распознает. Или вы думаете, что там у Платона такой органический глаз и такой же органический мозг компу подключен??? ИМХО, наиболее правильная идея о том, ч он берет оригинальную картинку, уменьшает, отражает, поворачивает и хранит целую пачку таких файликов, да еще и в разных палитрах и степенях сжатия. Возможно даже хранит результаты от Фотошопа, АсиДиси, Пеинта...

Большая часть картинок живет в JPEG, там исходник (Тифф или Рав, например) делется на сектора и каждый компрессируется отдельно, причем помимо сращивания сильно похожих цветов в градиенте, используется так же zip, но это уже в самом конце.

Матоды обмана: Крупный сложный (чтобы градиенты были) Вотермарк в углу (работает!)

Очень люблю фильтр "Размытие по поверхности" - полностью перелопачивает весь

код и при этом можно "вытянуть" качество, что-то вроде "гламурной ретуши", только

на автомате - идеально походит для порно!!!

Смена размера с последующим прогоном "РП"

А сверху и Вотермарк еще!!!

Короче чем больше фильтров, СЛОЖНЫХ!!! Тем лучше, банальной подкруткой яркости и контраста не обойтись!!! Это слишком просто и сто проц мониторится!!!

Кстати, мне еще понравилась идея с поворотом, но естественно не на 90, 180 и т.п. градусов. Как-то не думал об этом...

В итоге, если все заюзать в комплексе, то получится хорошо!!! В шопе можно макросы псать, но не во всех пиратских! И нужно учесть, что шоп крайне требователен к машинке, особенно, если открыть сразу много хай-рес изображений!!!

Можно еще зашумить, пузырьнуть да дофига там разных фильтриков.

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий