response

response
Рейтинг
324
Регистрация
01.12.2004
юни:
Ну, как сказать... считается, может быть, и много всяких параметров - но вот как они учитываются?

Если поисковик различает (не склеивает как дубликаты) фразы "пластиковые окна" и "деревянные стеклопакеты", то и картинки окон/пакетов он не "поклеит": они ж ведь весьма похожи.

Т.е., даже если алгоритм различает некие общие блоки в картинках, а не просто сравнивает биты (а даже при простом пережатии - матрица существенно меняется), то это ещё не повод считать сравниваемые образцы "нечётким дублем". ;)

да сам не знаю, вариантов много.

ну вот простейший-параноидальный: есть коллекция галерей для блогов. На каждом блоге они разные (пережатые в разных размерах, разный копирайт шлепнут). Но в принципе-то, если брать динамический размер блока (не восемь пикселей, а там пять процентов), и считать тупо средний rgb всех пикселей :) Я не разбираюсь в изображениях, ну че-нить там считать, не от непосредственно битов информации зависящее, а от того, как эта информация визуально представлена в итоге (цвет, яркость, etc.).

Вот так бьем каждую картинку на части, считаем средний "цвет", и, как мне кажется, удачно палим с высокой долей вероятности все ресайзы (ну, пикселей до 400-500 в ширину, наверное).

Что-то такое, примитивное, но в общем-то кажется верное..

эксперимент что-ли провернуть 🙄

юни:
Достаточно пережать. :)

у меня на каждой площадке копирайты разные в изображениях.

конечно, может дело не в этом. но все-таки... вы думаете у пс до сих пор считается тупо контрольная сумма файла? :)

(


Контрольная сумма для исключения дублей считается по оригинальному изображению, попиксельно, в RGB.

http://company.yandex.ru/grant/datasets_description.xml

)

зато вот тут кое-что поинтереснее: http://company.yandex.ru/grant/list.xml

1. Быстрая классификация JPEG–изображений.

2. Распознавание типовых портретных изображений в задаче автоматической классификации

это еще 2004-2005-й года. меня давно эти публикации напрягают понемногу :)

response добавил 08.02.2008 в 02:35

neznaika:
Совпадение до битов + одинаковый альт = дубликат.
Гугл читает дополнительную информацию, ресайзинг и сброс профиля тока.

а профиль это что? та инфа служебная, типа на каком девайсе фоткалось, когда и кем?

Ярик:
В 99 может и небыло, но в 96 уже точно был. 😂

не знаю, я в 98-м вроде в инет подтянулся, но порнуху все больше как-то по телевизору смотрел 😂

Оливковый:
как будто ничего и неизменилось )
/ru/forum/783

жееесть.. :)

не знал, что форуму так много лет.

я помню году в 99-00 видел такие странички, где сверху или снизу шло много-много текста по фону страницы, а список ключевых слов в метатегах занимал экрана три. правда ппц тогда вроде никаких небыло, и подобными приемами пользовались по-моему даже вполне себе "белые" сайты (хотя за ппц точно не скажу, я тогда вообще не в теме был). Зато адалта в 99-м вроде еще небыло )

вообще не меняю.

зы

зидан на аватаре? :) это знак! :)

Gnome:

ps Клоны задолбали(((

понаехавших не считать в итоге, всего и делов. только к кому вы с этим пойдете? и опять таки, не лучше ли просто курилку с активным модером выпросить? :)

rmikel:
БОЛЬШИНСТВО ПОЛЬЗОВАТЕЛЕЙ РУНЕТА - БОГАТЫЕ И ОБРАЗОВАННЫЕ ЛЮДИ
Несмотря на небольшой стаж общения с сетью, средний российский пользователь образованнее среднего европейского и при этом ненамного беднее - среднегодовой доход российских посетителей интернет-сайтов составляет $10 тыс.

это к чему вообще было-то? ца у дорвейщиков и недорвейщиков принципиально не различаются. я молчу о том, что выводы озвучены на мой взгляд левые какие-то.

la-la-la:
нафига десятку-другому человек аж 3 раздела :) ? это ж в 3 раза больше флудить надо будет, чтоб их в нужной кондиции держать!!

+как же вы забыли про ветку "предложения по ветке" - тут каждый божий день моно было бы обсуждать, кого модером назначат и какой раздел добавить нужно? - самые популярные темы в дорвеях!

бойтесь своих желаний, ведь они могут исполниться!!!! - придет модер, и хер тут кто что сказать сможет, будут все в бане за нецензурную брань и пиз**жь не по теме.

я бы просто кидал все левые темы в курилку, где не учитывать каменты к репе и не ворнить за мат-"вникуда".

mih4:
будет три раздела, мы в три раза больше яндексу спалим 🚬

стоит всем скопом отказаться от использования лички, и все - дороотдел яндекса загнется! :) и трех разделов не нужно :)

Всего: 3770