уникальность изображений

324

response

7 февраля 2008, 22:58

4258

как думаете, яша и ко уже палят уникальность изображений? у яши есть статьи на подобные темы в списке грантов, так может час х уже пришел?

я просто тут смотрю на свои сайтики, и думаю, что кроме фоток, хуиза и ип их ничего не объединяет. При этом одна выстреливает, две лежат мертвым грузом.

думаете я параноик? :bl:

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)

[Удален]

7 февраля 2008, 23:02

#1

Да,вот тоже интересно мнение профессионалов в сео:)

[Удален]

7 февраля 2008, 23:04

#2

Думаем, что пока еще им рано. Пока что приоритетны только разборки с оптимизаторами. :)

[Удален]

7 февраля 2008, 23:18

#3

Знаете, gogo.ru по порнушным картинкам плохо ищет, куча одинаковых картинок!

В яндексе же повтореений нет! Думаю яндекс дубли определяет, тем более это делается несложно. Хуже когда картинка немного изменена...

А уникальные картинки так сложно делать?

[Удален]

7 февраля 2008, 23:21

#4

Не сложно - просто дорого нынче заказывать альт-копирайтинг.

938

юни

7 февраля 2008, 23:25

#5

ЧерныйKот:
А уникальные картинки так сложно делать?

Достаточно пережать. :)

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит

356

neznaika

7 февраля 2008, 23:32

#6

Совпадение до битов + одинаковый альт = дубликат.

Гугл читает дополнительную информацию, ресайзинг и сброс профиля тока.

Дорого покупаю настоящие сайты. Не инвестирую деньги и не беру кредиты.

324

response

7 февраля 2008, 23:34

#7

юни:
Достаточно пережать. :)

у меня на каждой площадке копирайты разные в изображениях.

конечно, может дело не в этом. но все-таки... вы думаете у пс до сих пор считается тупо контрольная сумма файла? :)

(

Контрольная сумма для исключения дублей считается по оригинальному изображению, попиксельно, в RGB.

http://company.yandex.ru/grant/datasets_description.xml

)

зато вот тут кое-что поинтереснее: http://company.yandex.ru/grant/list.xml

1. Быстрая классификация JPEG–изображений.

2. Распознавание типовых портретных изображений в задаче автоматической классификации

это еще 2004-2005-й года. меня давно эти публикации напрягают понемногу :)

response добавил 08.02.2008 в 02:35

neznaika:
Совпадение до битов + одинаковый альт = дубликат.
Гугл читает дополнительную информацию, ресайзинг и сброс профиля тока.

а профиль это что? та инфа служебная, типа на каком девайсе фоткалось, когда и кем?

Google Updates - апдейты Стоит ли верить в Запрет индексации части страницы?

938

юни

7 февраля 2008, 23:48

#8

response:
у меня на каждой площадке копирайты разные в изображениях.

конечно, может дело не в этом. но все-таки... вы думаете у пс до сих пор считается тупо контрольная сумма файла?

Ну, как сказать... считается, может быть, и много всяких параметров - но вот как они учитываются?

Если поисковик различает (не склеивает как дубликаты) фразы "пластиковые окна" и "деревянные стеклопакеты", то и картинки окон/пакетов он не "поклеит": они ж ведь весьма похожи.

Т.е., даже если алгоритм различает некие общие блоки в картинках, а не просто сравнивает биты (а даже при простом пережатии - матрица существенно меняется), то это ещё не повод считать сравниваемые образцы "нечётким дублем". ;)

Google Updates - апдейты PBN ссылки Похожий домен

324

response

8 февраля 2008, 00:22

#9

юни:
Ну, как сказать... считается, может быть, и много всяких параметров - но вот как они учитываются?

Если поисковик различает (не склеивает как дубликаты) фразы "пластиковые окна" и "деревянные стеклопакеты", то и картинки окон/пакетов он не "поклеит": они ж ведь весьма похожи.

Т.е., даже если алгоритм различает некие общие блоки в картинках, а не просто сравнивает биты (а даже при простом пережатии - матрица существенно меняется), то это ещё не повод считать сравниваемые образцы "нечётким дублем". ;)

да сам не знаю, вариантов много.

ну вот простейший-параноидальный: есть коллекция галерей для блогов. На каждом блоге они разные (пережатые в разных размерах, разный копирайт шлепнут). Но в принципе-то, если брать динамический размер блока (не восемь пикселей, а там пять процентов), и считать тупо средний rgb всех пикселей :) Я не разбираюсь в изображениях, ну че-нить там считать, не от непосредственно битов информации зависящее, а от того, как эта информация визуально представлена в итоге (цвет, яркость, etc.).

Вот так бьем каждую картинку на части, считаем средний "цвет", и, как мне кажется, удачно палим с высокой долей вероятности все ресайзы (ну, пикселей до 400-500 в ширину, наверное).

Что-то такое, примитивное, но в общем-то кажется верное..

эксперимент что-ли провернуть 🙄

В Finteza появилась скорость Падение трафа и GPT Упал доход

938

юни

8 февраля 2008, 00:35

#10

response:
эксперимент что-ли провернуть

Разве что. ;)

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы