Для алгоритмов это не проблема. Пример:
Как видно, большое и малое изображение имеют один и тот же хэш.
Делаем выборку:
У меня 200К картинок и как видно, некоторые "отдают похожестью", но вот выделенные красным цветом - это две картинки с машинкой - большие и маленькие.
Делаем так теперь:
Изображение с водяным знаком тоже однозначно идентифицировано как дубликат:
Ага. А можно вообще черным цветом замазать и предъявить претензии, что алгоритм не работает)
Прогнал базу изображений, получил хэши (в бинарном виде и в числовом).
Теперь поиск по картинке:
Нормально работает. Алгоритм Average Hash. Находит картинки уменьшенные и с надписями на них. Не находит обрезанные.
Какие я данные и кому передаю? Это не уголовные, а гражданские дела. Никто не будет вычислять по IP пользователя, загрузившего фото очередного непризнанного гения-фотографа, который хочет через очередную говнофриму поиметь с владельца сайта денег.
Не воровать вам, конечно же, и в голову не приходило. А ведь это самый простой и дешёвый способ.
В голову не приходило, что есть сервисы, где контент добавляют пользователи?
Железобетонный аргумент.
Как владелец сайта/домена с 2009 года ответственно заявляю, что возраст домена скорее учитывается бингом или дакдакгоу ,(там сайт в топ3 по вч запросам), но точно не Яндексом - сайта в выдаче просто нет!
Вопрос из серии "подумайте за меня". Подскажите, стоит ли включать данные опции и если да, кто какие параметры установить?
Про это речь?
сегодня, пока не зашёл на форум, решил грохнуть учётную запись сайта на CF и создать новую, думал, поможет. И вот столкнулся с тем, что CF мне не даёт опять домен добавить, пишет, оплатите счета.
Я что-то не понимаю в "бесплатном тарифе" CF? Что это: