Уникализация картинок для Яндекса

12
N
На сайте с 11.08.2004
Offline
176
#11

развиваю мысль

1 яндекс анализирует картинки программым путем

2 код файла у разноразмерных картинок разный

3 следовательно он не тупо сравнивает код картинок а умеет определять насколько они похожи

4 программа умеет распознавать watermark на картинках по алгоритму повторных сочетаний пикселей на всех картинках сайта следовательно пиксели под watermark переносятся в разряд нейтральных

следовательно нужно делать различные надписи на картинках разными шрифтами аля капча

OJ
На сайте с 12.12.2006
Offline
26
#12
fogmaker:
оно?

хе, забавная статейка.

+1

A
На сайте с 22.11.2008
Offline
101
#13

Ребята а никто не задумывался какие мощностя нужны для этого?

В инете ~3,5 млрд. сайтов, на каждом по 10-10000 картинок, это около ~350 000 000 000 картинок, какие ресурсы железа нужны чтобы их сравнить друг с другом на наличие дубликатов?

Если это можно спалить, то не обязательно что из палят.

SJ
На сайте с 16.03.2008
Offline
78
#14
allias:
Ребята а никто не задумывался какие мощностя нужны для этого?
В инете ~3,5 млрд. сайтов, на каждом по 10-10000 картинок, это около ~350 000 000 000 картинок, какие ресурсы железа нужны чтобы их сравнить друг с другом на наличие дубликатов?

Нам же не в риалтайме сравнивать надо, правильно? Давайте рассмотрим пессиместический вариант.

Посчитать грубо говоря(!) "хеш" картинки занимает думаю совсем не много. 100 картинок в секунду на выделенном сервере - как нефиг делать.

Считаем: 100 * 60 (сек) * 60 (мин) * 24 = 8640000 обработанных изображений в сутки.

Это 259 200 000 обработаных изображений в месяц. На одном сервере.

Так что именно эта задача "не сложная" - тут есть куда расти простым наращиванием технических мощностей. Да и паралелится на ура. 10 серверов поставил (15-20к всего) - и в 9 раз скорость выросла.

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
Hubba_Bubba
На сайте с 26.11.2005
Offline
75
#15

allias,

а зачем сейчас обсуждать мощности, если Яндекс уже это реализовал?

Сейчас надо думать как уникализировать картинки.

На этом фруме уже обсуждалась немного эта тема. Было мнение что картинку можно обрезать со всех сторон.

Сайт экономистов БелГУТа (http://economistov.net)
K
На сайте с 04.12.2008
Offline
0
#16

Тестил на новомодном сервисе гугла. tiny что-то там.

Беру изображение шоколадного мороженного с клубникой.

Закачиваю его на проверку > минута ожидания и результат 11 000 с копейками.

Инвертирую изображение и опять закачиваю > 4 совпадения.

Накладываю в рамку шириной 5 мм. (на глазок вообщем :) результат совпадений 0!

Вообщем зря деньги на разработки они убили. Это даже без каких либо особых ухищрений.

А если поискать и потестить еще, можно все изменить на "автомате".

з.ы Когда я свои фотографии увидел в выдаче "Я" и репорт им слал и что только не делал - черта лысого они убрали те изображения из выдачи. Им по..

Теперь там мои фотографии, которые я лично снимал, и линк под фото ведет на другой сайт:) Лолище. "Я" отстой.

з.ы 2. Любители и защитники ПС идут ... . Ума еще просто мало понять, что им навязывают политику и ведут как слепырей на поводке.

OnCat
На сайте с 21.10.2008
Offline
83
#17

О, актуальная тема. Купил на днях новый домен, адрес больно хорош, поставил Coppermine Photo Gallery. Кто работает с фотогалереями, не сочтите за труд, киньте пару строк, как лучше подойти к организации сего детища.... Фотогалереи в интернете вообще, и Coppermine Photo Gallery в частности.

Всегда Ваш
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий