Что есть интернет, вообще, как ни один большой сплошной копипаст? - Doorways & Cloaking

к разговору об уникальности фоток

response · 2026-07-01T11:07:27.0000000Z

Помните проигнорированный массами тред про уникальность картинок ? недавно только заметил, что яндекс уже вовсю палит дубли по инету: рядом с каждой картинкой на images.yandex.ru висят ссылки на ее копии в других разрешениях. Попячьтесь любители заюзанных сетов, а также любители подоказывать, что все_у_них_уникальное_а_яндекс_спалил_непонятно_ваще_как. Идеи по обходу в треде (см. ссылку выше). Краткая выжимка здесь: http://l00t.ru/search-engines-n-stuff/se-images-identity-findin-galakteko-opasnoste.html

106

Ленивое Z

6 декабря 2008, 13:18

#11

response, есть сайт tineye.com (правда зарегистрироваться там надо, но это стоит посмотреть). Смыл тот же - ищет одинаковые картинки. После регистрации, если вставить для поиска вот этот урл (картинка с бизнес-линча) http://img.artlebedev.ru/kovodstvo/business-lynch/files/1/E/1EB31BF6-31F0-474F-BAC9-6109164AD9D2.jpg, то находится 5 совпадений, причем они заметно различимы (и искажение в пропорциях, и с дополнительными надписями, и полоски по бокам (это насчет предыдущей статьи)).

Это, конечно не Яндекс, но неизвестно кто кого обогнал в развитии алгоритма, может у Яндекса еще круче.

Стоит ли открывать для Блокировка площадки в РСЯ Новый алгоритм Яндекса "во

324

response

6 декабря 2008, 13:22

#12

nbd:
А если взять в расчет то, что помимо фото есть еще и схемы, графики, диаграммы и иже с ними. Программно "нарисовать" десяток-другой подобных "схем" не проблема, да и добавить подпись в картинку (легенда, виды обзора: вид сверху, вид снизу, нумерация рисунков: рис 1, рис 2, дата и т.д.) не вызовет большой проблемы. Просто ИМХО создать новую картинку проще чем рерайтить уже имеющуюся.

ясен хрен проблема у тех, кто фришный контент юзает для конвертации, ну че вы тоже. Понятно, что если печатаешь классические доры, ты можешь тупо пиксели разноцветные туда впендюрить, но людей с таким подходом здесь все меньше и меньше.

Кстати, а может будет вариант от обратного - если сомнительный сайтик состоит сплошь и рядом из уникальных фоток, это повод для пристальной проверки :)

короче, по-моему это все есть новый источник для паранойки. если вас это не напрягает, можно только порадоваться за используемый вами подход :)

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)

R

38

rearranger

6 декабря 2008, 13:22

#13

И правда цели не ясны,

ну ищет яндекс дубликаты, ну добавляет в поиск

всем хорошо

санкциями за это никто не пугал

53

Beliar

6 декабря 2008, 13:29

#14

Способ определения картинок №1: Если сравнивать картинку не полностью во всех цветах, а например в грейскейл, с каким-нибудь размазыванием. То вставка в картинку ватермарка, или пары пикселей "левых" нидаст никакого эффекта, ибо они в итоге будут практически идентичными.

Способ определения картинок №2: Если по картинке строить образы обьектов (из любой картинки делать ч/б образ) и приводить образы к единому какому-то размеру, то ресайз тоже сходит на нет. Если эти образы сжимать/растягивать, то можно отсекти и непропорциональные картинки.

Тут вариантов много, но зачем это все яндексу непонятно.

...Всё началось не со зла, всё началось, как игра... Мой блог (http://umaxsoft.com/blog/) || Десктопный парсер (http://umaxsoft.com/projects/usep-2/) (обсуждение (/ru/forum/397072)) || Массовая проверка PR и тИЦ (http://umaxsoft.com/projects/works-mass-pr-cy-checker/)

324

response

6 декабря 2008, 13:29

#15

rearranger:
И правда цели не ясны,
ну ищет яндекс дубликаты, ну добавляет в поиск
всем хорошо
санкциями за это никто не пугал

ну ждите, пока испугают.

41

fogmaker

6 декабря 2008, 13:31

#16

response:
ну ждите, пока испугают.

чем они испугают-то, можешь пояснить? что есть интернет, вообще, как ни один большой, сплошной копипаст?

…waiting for a miracle. (https://fogmaker.net/)

324

response

6 декабря 2008, 13:35

#17

fogmaker:
чем они испугают-то, можешь пояснить?

нет. ничего нового кроме того, что уже сказано, я не скажу.

41

fogmaker

6 декабря 2008, 13:39

#18

response:
нет. ничего нового кроме того, что уже сказано, я не скажу.

тогда я скажу. в общем, так. если искалки научатся, со временем, определять оригинал, с коего и поползли в разные стороны копии, то это будет лишь респект оригиналу и домену, на котором он впервые объявился. но никаких зверств по отношению к копиям быть не может априори. на копипасте, кросслинках и держится сам интернет и само определение релевантности в серпе.

в настоящее же время ранжирование серпа строится на абсолютно иных принципах. и все мы это прекрасно видим, когда копипаст с блога имярек, попавший (к примеру) на kp.ru занимает первое место в серпе по точному вхождению в документ, а источника нет и в сотне. несмотря на наличие внешней с указанием источника и захотлинкенных пиксов с донора в теле копипаст-документа.

324

response

6 декабря 2008, 13:47

#19

fogmaker:
тогда я скажу. в общем, так. если искалки научатся, со временем, определять оригинал, с коего и поползли в разные стороны копии, то это будет лишь респект оригиналу и домену, на котором он впервые объявился. но никаких зверств по отношению к копиям быть не может априори. на копипасте, кросслинках и держится сам интернет и само определение релевантности в серпе.

о варианте с вниманием к оригинальному источнику я писал. Твои слова я прочитал как "все нормально - вы просто не будете в топе". поправь меня, если это не так.

41

fogmaker

6 декабря 2008, 13:54

#20

response:
о варианте с вниманием к оригинальному источнику я писал. Твои слова я прочитал как "все нормально - вы просто не будете в топе". поправь меня, если это не так.

уже. пока ты писал ответ, я добавление к предыдущему посту сделал, отвечающее на твой ответ.

в настоящее же время ранжирование серпа строится на абсолютно иных принципах. и все мы это прекрасно видим, когда копипаст с блога имярек, попавший (к примеру) на kp.ru занимает первое место в серпе по точному вхождению в документ, а источника нет и в сотне. несмотря на наличие внешней с указанием источника и захотлинкенных пиксов с донора в теле копипаст-документа.

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

к разговору об уникальности фоток