уникальность изображений

12 3
response
На сайте с 01.12.2004
Offline
324
4227

как думаете, яша и ко уже палят уникальность изображений? у яши есть статьи на подобные темы в списке грантов, так может час х уже пришел?

я просто тут смотрю на свои сайтики, и думаю, что кроме фоток, хуиза и ип их ничего не объединяет. При этом одна выстреливает, две лежат мертвым грузом.

думаете я параноик? :bl:

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
[Удален]
#1

Да,вот тоже интересно мнение профессионалов в сео:)

[Удален]
#2

Думаем, что пока еще им рано. Пока что приоритетны только разборки с оптимизаторами. :)

[Удален]
#3

Знаете, gogo.ru по порнушным картинкам плохо ищет, куча одинаковых картинок!

В яндексе же повтореений нет! Думаю яндекс дубли определяет, тем более это делается несложно. Хуже когда картинка немного изменена...

А уникальные картинки так сложно делать?

[Удален]
#4

Не сложно - просто дорого нынче заказывать альт-копирайтинг.

юни
На сайте с 01.11.2005
Offline
933
#5
ЧерныйKот:
А уникальные картинки так сложно делать?

Достаточно пережать. :)

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
neznaika
На сайте с 28.06.2006
Offline
356
#6

Совпадение до битов + одинаковый альт = дубликат.

Гугл читает дополнительную информацию, ресайзинг и сброс профиля тока.

Дорого покупаю настоящие сайты. Не инвестирую деньги и не беру кредиты.
response
На сайте с 01.12.2004
Offline
324
#7
юни:
Достаточно пережать. :)

у меня на каждой площадке копирайты разные в изображениях.

конечно, может дело не в этом. но все-таки... вы думаете у пс до сих пор считается тупо контрольная сумма файла? :)

(


Контрольная сумма для исключения дублей считается по оригинальному изображению, попиксельно, в RGB.

http://company.yandex.ru/grant/datasets_description.xml

)

зато вот тут кое-что поинтереснее: http://company.yandex.ru/grant/list.xml

1. Быстрая классификация JPEG–изображений.

2. Распознавание типовых портретных изображений в задаче автоматической классификации

это еще 2004-2005-й года. меня давно эти публикации напрягают понемногу :)

response добавил 08.02.2008 в 02:35

neznaika:
Совпадение до битов + одинаковый альт = дубликат.
Гугл читает дополнительную информацию, ресайзинг и сброс профиля тока.

а профиль это что? та инфа служебная, типа на каком девайсе фоткалось, когда и кем?

юни
На сайте с 01.11.2005
Offline
933
#8
response:
у меня на каждой площадке копирайты разные в изображениях.

конечно, может дело не в этом. но все-таки... вы думаете у пс до сих пор считается тупо контрольная сумма файла?

Ну, как сказать... считается, может быть, и много всяких параметров - но вот как они учитываются?

Если поисковик различает (не склеивает как дубликаты) фразы "пластиковые окна" и "деревянные стеклопакеты", то и картинки окон/пакетов он не "поклеит": они ж ведь весьма похожи.

Т.е., даже если алгоритм различает некие общие блоки в картинках, а не просто сравнивает биты (а даже при простом пережатии - матрица существенно меняется), то это ещё не повод считать сравниваемые образцы "нечётким дублем". ;)

response
На сайте с 01.12.2004
Offline
324
#9
юни:
Ну, как сказать... считается, может быть, и много всяких параметров - но вот как они учитываются?

Если поисковик различает (не склеивает как дубликаты) фразы "пластиковые окна" и "деревянные стеклопакеты", то и картинки окон/пакетов он не "поклеит": они ж ведь весьма похожи.

Т.е., даже если алгоритм различает некие общие блоки в картинках, а не просто сравнивает биты (а даже при простом пережатии - матрица существенно меняется), то это ещё не повод считать сравниваемые образцы "нечётким дублем". ;)

да сам не знаю, вариантов много.

ну вот простейший-параноидальный: есть коллекция галерей для блогов. На каждом блоге они разные (пережатые в разных размерах, разный копирайт шлепнут). Но в принципе-то, если брать динамический размер блока (не восемь пикселей, а там пять процентов), и считать тупо средний rgb всех пикселей :) Я не разбираюсь в изображениях, ну че-нить там считать, не от непосредственно битов информации зависящее, а от того, как эта информация визуально представлена в итоге (цвет, яркость, etc.).

Вот так бьем каждую картинку на части, считаем средний "цвет", и, как мне кажется, удачно палим с высокой долей вероятности все ресайзы (ну, пикселей до 400-500 в ширину, наверное).

Что-то такое, примитивное, но в общем-то кажется верное..

эксперимент что-ли провернуть 🙄

юни
На сайте с 01.11.2005
Offline
933
#10
response:
эксперимент что-ли провернуть

Разве что. ;)

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий