Как Yandex идентифицирует картинки?

1 234
[Удален]
#31
SubAqua:
Странно, суть этой темы здесь раскрыли два человека. Видимо остальные так увлечены вопросами что не видят ответов.

да вы такой умный) 😂 поставили мне минус

http://images.yandex.ru/yandsearch?rpt=simage&icolor=green&text=jennifer%20lopez&img_url=fireboul.narod.ru/showbiz2/jennifer_lopez007.jpg&p=6

http://images.yandex.ru/yandsearch?rpt=simage&icolor=green&text=jennifer%20lopez&img_url=games-all.com/celebrities-photo/jennifer-lopez-hot-photo.jpg&p=7

Levshin добавил 28.11.2010 в 17:42

immo:
Странно, почему вот эти две картинки (Адин!1! и Два!) ЯША видит как разные?

да странно, по идее должен был спалить..

вот еще интересное нашел - один, два

небольшое размытие картинки сделало ее уникальной ;)

еще подобный пример: один, два. Вторая фотка чуть-чуть подразмыта, яндекс счел ее уникальной.

p.s. Как сказал один из директоров отдела Яндекса, почему-то многие думают что у нас идиоты работают :)

нее нее нее, профессионалы высшей категории ;)

O6
На сайте с 25.05.2010
Offline
37
#32

Короче я понял, что здесь творится...

Происходящее в этом топике как две капли воды похоже на разговоры про смерть XSS. Уважаемые форумчане, хотите запудрить людям мозги? Чтобы обащались за раскруткой именно к вам?

Повторюсь в очередной раз у машин НЕ ХВАТИТ АППАРАТНОГО ВРЕМЕНИ! Приоритет для любой ПС - текстовый поиск: ранжирование, индексация, краулинг, синхронизация и т.д. Неоднократно поднимались такие темы, что темпы роста интернета сильно опережают аппартаные возможности самих ПС. На колличество операций, описанных вами для обнаружения уникальных картинок ушла бы львиная доля машинных возможностей ПС. Они НЕ ПОЙДУТ НА ЭТО, т.к. ото может повлечь за собой снижение качества текстового поиска, который, кстати, является основным источником ихнего дохода.

Последний довод - любая ПС способна проиндексировать Flash, для этого достаточно использовать простой интерпритатор, который сможет открыть и проиндексировать flash тексты за доли секунд, но вместо этого они только вытаскивают ссылки (и то не всегда). Так вот для инициации описанных вами процессов необходимо НАМНОГО больше процессорного времени, поэтому ваши слова ничего не стоят. Я останусь при своем мнении + ко всему мой метод уникализации работает и мне всеравно на ваши доводы!

Мой SEO блог (http://www.markintalk.ru/) Как создать свой сайт БЕСПЛАТНО. (http://www.eltisbook.ru)
RIVA3
На сайте с 08.04.2008
Offline
98
#33
Странно, суть этой темы здесь раскрыли два человека. Видимо остальные так увлечены вопросами что не видят ответов.

Мне всегда нравились ответы такого формата.) Наставник вы наш...

Вы бы или подсказали людям или флейм не запускали бы...

Вопрос тем не в том, какой вы загадочный. А в том, КАК Яндекс идентифицирует картинки.

RIVA3 добавил 28.11.2010 в 22:00

да вы такой умный) поставили мне минус

Да я о том же.

Все, блин, такие умные. Знают, что не работает и каким именно не работает. А вот, что работает - ответов точных не дают, хотя название у темы вполне понятное. Уж лучше бы молчали, если есть большое желание поучить молодежь навыки самостоятельного поиска и анализа.

B
На сайте с 30.11.2010
Offline
0
#34

Привет чудики ).

Все намного проще и прозаичнее.

В общем делает он это так, идет в верхний левый угол, берет N количество пикселей подряд(чем больше берет тем больше точность).

И создает массив из таких картинок. И в тупую сравнивает.

Если процент совпадений больше нужного, то картинки одинаковые.

Время минимально тратится,а отсеивается думаю что 99% дублей.

Поэтому то ваши логотипы и переименование картинки и расширения не помогает.

Ну а если и это не помогает, то бросает Весь свой потенциал и строит гистограммы, графики распределений, рассеивания, освещенности и прочей лабуды.

p.s. картинки разные для вышестоящего, так как пикселы в левом углу верхнем разные и часть из них обрезана.

O6
На сайте с 25.05.2010
Offline
37
#35
booyanka:
Привет чудики ).

Все намного проще и прозаичнее.

В общем делает он это так, идет в верхний левый угол, берет N количество пикселей подряд(чем больше берет тем больше точность).
И создает массив из таких картинок. И в тупую сравнивает.

Если процент совпадений больше нужного, то картинки одинаковые.

Время минимально тратится,а отсеивается думаю что 99% дублей.

Поэтому то ваши логотипы и переименование картинки и расширения не помогает.

Ну а если и это не помогает, то бросает Весь свой потенциал и строит гистограммы, графики распределений, рассеивания, освещенности и прочей лабуды.


p.s. картинки разные для вышестоящего, так как пикселы в левом углу верхнем разные и часть из них обрезана.

Вот с этим полностью согласен, а то, так называемые местные гуру только и умеют, что "-" ставить

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий