Как Яндекс определяет дубликаты картинок?

1 2345 6
V
На сайте с 21.03.2005
Offline
99
#21
0bevan:
Сделать зеркальное отображение картинки :)

Выше уже написали, что зеркальное отображение сечется "на ура", читайте внимательнее. Да и по логике, самое элементарное для Яши это проверить зеркальные отображения вместе с шинглами и пр.

Методика духовного продвижения, которая была скрыта более 2 тысяч лет ответила на вопрос в чем смысл жизни (http://www.smysl-zhizni.info) человечества.
Bitman
На сайте с 05.07.2009
Offline
112
#22

У кого есть образец поиска по Яндекс картинкам, с вариантом повёрнутой картинки?

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
SEO-MAN
На сайте с 25.06.2007
Offline
187
#23

А почему бы яндексу алгоритмом не сделать варианты катинки - оригинал, зеркальный, перевороты и повороты поградусно, и с ними тоже сравнивать? Или это нагрузит сервера?

Форум сео (http://forum-seo.net) для новичков автоматическая регистрация в 30000 каталогах за 5$ (/ru/forum/157861) Нужна доработка 2 досок объявлений - avtopmr.net, pmrdom.com (вип объявления и удаление дублей)
Maxiz
На сайте с 04.01.2008
Offline
208
#24

У меня яндекс определяет дупликаты в случае если фотка с водяным знаком (большие полупрозрачные буквы на всю картинку) и без.

VA
На сайте с 07.03.2008
Offline
19
#25

Вот

Конечно, скоро выдача будет несколько иной. Но пример показывает, что Я узнает рамку и разные подписи.

Уменьшаем битность, вычисляем взвешенную последовательность цветов (по горизонтали или вертикали, а где нет быстрой смены цветов в перпендикулярной плоскости, пишем в базу как хеш-код), например, 0.3 синих -- 0.3 черных -- 0.2 зеленых -- 0.2 синих == 1 линия. И так несколько линий.

Если с очередной картинки полученное множество весов является подмножеством уже занесенного в базу (и наоборот), то это вероятно дубль. Чем больше совпадений множеств, тем вероятнее, что это дубль.

dlyanachalas
На сайте с 15.09.2006
Offline
693
#26
VictorAl:
Вот
Конечно, скоро выдача будет несколько иной. Но пример показывает, что Я узнает рамку и разные подписи.

Где вы там рамку увидели? :) Если уж делать рамку, то толстую. Иначе всё бессмысленно.

VA
На сайте с 07.03.2008
Offline
19
#27
dlyanachalas:
Где вы там рамку увидели? :) Если уж делать рамку, то толстую. Иначе всё бессмысленно.

тут: http://6494876.ru/images/fotowall/nature%20099.jpg

Рамка не влияет. Если только размытая и по ширине в половину изображения.

dlyanachalas
На сайте с 15.09.2006
Offline
693
#28
VictorAl:
тут: http://6494876.ru/images/fotowall/nature%20099.jpg
Рамка не влияет. Если только размытая и по ширине в половину изображения.

Не в половину. 10% будет достаточно.

seo_man
На сайте с 17.02.2007
Offline
62
#29

ТС, просто интересно, с какой целью интересуетесь?

По теме: есть несколько способов определения т.н. "нечетких дубликатов". Под "нечетким дубликатом" я понимаю то что если взять фотку, изменить ей разрешение, немножко обрезать по краям, наложить пару водяных знаков, изменить формат с gif на jpg - то файл по структуре изменится на 100%, но визуально человек видит что это одна и та же фотка. Именно поэтому, как тут писали выше, Яндекс определяет дубликат и с водяными знаками, и с прочими преобразованиями.

Про "рамки", "зеркальное отражение" и т.д. - попробуйте реализовать сами - и поймете что "нечеткие дубликаты" такими способами не отыскать.

Как это делает конкретно Яндекс - знает только сам Яндекс. Но сами технологии - давно уже не секрет, нужно только погуглить.

P.S. В свое время мне приходила идея сделать что то типа поисковика по картинкам. Т.е. не как у Яндекса - введи ключевое слово - получи результат, а загрузи оригинал - и найди все копии или похожие картинки. Но че то не нашел в этой идее ничего коммерчески-привлекательного, хотя как сделать - примерно представляю.

_Владимир_
На сайте с 04.06.2007
Offline
75
#30
Bebs:
исключительно по коду..

Bebs, а Вы не читали темку примерно месяц назад, если не ошибаюсь dadot создавал, он показывал очень интересный пример изображения (ноты) который Яндекс посчитал дубликатом, что здесь скажете по Вашей теории "исключительно по коду" или это как подбор коллизии при бруте md5 ?

черно / белая рассада seo icq: 426-714-284 (Владимир)
1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий