к разговору об уникальности фоток

123 4
Ленивое Z
На сайте с 27.08.2007
Offline
106
#11

response, есть сайт tineye.com (правда зарегистрироваться там надо, но это стоит посмотреть). Смыл тот же - ищет одинаковые картинки. После регистрации, если вставить для поиска вот этот урл (картинка с бизнес-линча) http://img.artlebedev.ru/kovodstvo/business-lynch/files/1/E/1EB31BF6-31F0-474F-BAC9-6109164AD9D2.jpg, то находится 5 совпадений, причем они заметно различимы (и искажение в пропорциях, и с дополнительными надписями, и полоски по бокам (это насчет предыдущей статьи)).

Это, конечно не Яндекс, но неизвестно кто кого обогнал в развитии алгоритма, может у Яндекса еще круче.

response
На сайте с 01.12.2004
Offline
324
#12
nbd:
А если взять в расчет то, что помимо фото есть еще и схемы, графики, диаграммы и иже с ними. Программно "нарисовать" десяток-другой подобных "схем" не проблема, да и добавить подпись в картинку (легенда, виды обзора: вид сверху, вид снизу, нумерация рисунков: рис 1, рис 2, дата и т.д.) не вызовет большой проблемы. Просто ИМХО создать новую картинку проще чем рерайтить уже имеющуюся.

ясен хрен проблема у тех, кто фришный контент юзает для конвертации, ну че вы тоже. Понятно, что если печатаешь классические доры, ты можешь тупо пиксели разноцветные туда впендюрить, но людей с таким подходом здесь все меньше и меньше.

Кстати, а может будет вариант от обратного - если сомнительный сайтик состоит сплошь и рядом из уникальных фоток, это повод для пристальной проверки :)

короче, по-моему это все есть новый источник для паранойки. если вас это не напрягает, можно только порадоваться за используемый вами подход :)

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
R
На сайте с 30.12.2007
Offline
38
#13

И правда цели не ясны,

ну ищет яндекс дубликаты, ну добавляет в поиск

всем хорошо

санкциями за это никто не пугал

Beliar
На сайте с 30.08.2005
Offline
53
#14

Способ определения картинок №1: Если сравнивать картинку не полностью во всех цветах, а например в грейскейл, с каким-нибудь размазыванием. То вставка в картинку ватермарка, или пары пикселей "левых" нидаст никакого эффекта, ибо они в итоге будут практически идентичными.

Способ определения картинок №2: Если по картинке строить образы обьектов (из любой картинки делать ч/б образ) и приводить образы к единому какому-то размеру, то ресайз тоже сходит на нет. Если эти образы сжимать/растягивать, то можно отсекти и непропорциональные картинки.

Тут вариантов много, но зачем это все яндексу непонятно.

...Всё началось не со зла, всё началось, как игра... Мой блог (http://umaxsoft.com/blog/) || Десктопный парсер (http://umaxsoft.com/projects/usep-2/) (обсуждение (/ru/forum/397072)) || Массовая проверка PR и тИЦ (http://umaxsoft.com/projects/works-mass-pr-cy-checker/)
response
На сайте с 01.12.2004
Offline
324
#15
rearranger:
И правда цели не ясны,
ну ищет яндекс дубликаты, ну добавляет в поиск
всем хорошо
санкциями за это никто не пугал

ну ждите, пока испугают.

fogmaker
На сайте с 13.02.2007
Offline
41
#16
response:
ну ждите, пока испугают.

чем они испугают-то, можешь пояснить? что есть интернет, вообще, как ни один большой, сплошной копипаст?

…waiting for a miracle. (https://fogmaker.net/)
response
На сайте с 01.12.2004
Offline
324
#17
fogmaker:
чем они испугают-то, можешь пояснить?

нет. ничего нового кроме того, что уже сказано, я не скажу.

fogmaker
На сайте с 13.02.2007
Offline
41
#18
response:
нет. ничего нового кроме того, что уже сказано, я не скажу.

тогда я скажу. в общем, так. если искалки научатся, со временем, определять оригинал, с коего и поползли в разные стороны копии, то это будет лишь респект оригиналу и домену, на котором он впервые объявился. но никаких зверств по отношению к копиям быть не может априори. на копипасте, кросслинках и держится сам интернет и само определение релевантности в серпе.

в настоящее же время ранжирование серпа строится на абсолютно иных принципах. и все мы это прекрасно видим, когда копипаст с блога имярек, попавший (к примеру) на kp.ru занимает первое место в серпе по точному вхождению в документ, а источника нет и в сотне. несмотря на наличие внешней с указанием источника и захотлинкенных пиксов с донора в теле копипаст-документа.

response
На сайте с 01.12.2004
Offline
324
#19
fogmaker:
тогда я скажу. в общем, так. если искалки научатся, со временем, определять оригинал, с коего и поползли в разные стороны копии, то это будет лишь респект оригиналу и домену, на котором он впервые объявился. но никаких зверств по отношению к копиям быть не может априори. на копипасте, кросслинках и держится сам интернет и само определение релевантности в серпе.

о варианте с вниманием к оригинальному источнику я писал. Твои слова я прочитал как "все нормально - вы просто не будете в топе". поправь меня, если это не так.

fogmaker
На сайте с 13.02.2007
Offline
41
#20
response:
о варианте с вниманием к оригинальному источнику я писал. Твои слова я прочитал как "все нормально - вы просто не будете в топе". поправь меня, если это не так.

уже. пока ты писал ответ, я добавление к предыдущему посту сделал, отвечающее на твой ответ.


в настоящее же время ранжирование серпа строится на абсолютно иных принципах. и все мы это прекрасно видим, когда копипаст с блога имярек, попавший (к примеру) на kp.ru занимает первое место в серпе по точному вхождению в документ, а источника нет и в сотне. несмотря на наличие внешней с указанием источника и захотлинкенных пиксов с донора в теле копипаст-документа.
123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий