как images.google отбирает реальные, уникальные фотографии?

12
B
На сайте с 21.09.2005
Offline
2
1222

На страницах ведь куча элементов дизайна порой, но гугл хватает только фотографии, при чем выдачу дает уникальных фото. Пытался дать казалось бы узкий запрос, где б должно быть куча однообразных фото, нет...дает уникальные...

Парсит ли он картинки на предмет выявления уникальности аль нет, вот в чем вопрос. Если да, то какими ж это ресурсами надо обладать...

Lor
На сайте с 28.05.2004
Offline
352
Lor
#1
Парсит ли он картинки на предмет выявления уникальности аль нет, вот в чем вопрос. Если да, то какими ж это ресурсами надо обладать...

File size, content type.

Йопез - форум без модераторов. https://yopez.com
B
На сайте с 21.09.2005
Offline
2
#2

были мысли по размеру...то есть к примеру обращать внимание на картинки больше 200 пикселов , а сто контент тайп ?

Lor
На сайте с 28.05.2004
Offline
352
Lor
#3
были мысли по размеру...то есть к примеру обращать внимание на картинки больше 200 пикселов , а сто контент тайп ?

content type > jpg, gif, tiff ....

A
На сайте с 10.01.2005
Offline
106
#5

Еще, по-моему, смотрит альты на предмет идентичности

Сайты для людей - не выдумка, а быль. Если считать архитекторов и дизайнеров людьми:)Целевая реклама для целевой группы.
B
На сайте с 21.09.2005
Offline
2
#6
content type > jpg, gif, tiff ....

и что с того, ну увидел он жпег к примеру, и как это повлияет на дальнейшие действия ?

-=Илья=- Да, теория об отборе по размеру не идет...

Еще, по-моему, смотрит альты на предмет идентичности

альты тоже непричем, то есть то, что обращается на них внимание, понятно, но в базе большинство картинок вообще без этих альтов

B
На сайте с 29.03.2003
Offline
147
#7

вещь интересная

скорее всего аналог медиапартнёра(бота) тоесть не в картинке дело а в конте на страничке.

на опытах удавалось одну картинку поднять по разным тематикам

дело годовалой давности правда

если уж совсем интересно кину в личку подробности теста.

UltraBait
На сайте с 10.05.2005
Offline
220
#8

В свое время после удачного кушанья одной картинки с гугла сливалось более 20к человек в сутки. Жаль больше подобного не происходило :( Сайт состоял из более чем 1000 страниц и все ссылались на одну картинку.

Lor
На сайте с 28.05.2004
Offline
352
Lor
#9

Распознает по названию файла, директории, альту, тексту линка, окружающему тексту и пр.

Для удаления идеинтичных можно использовать размер файла - хоть на 2 бита, но разные картинки будут отличаться.

При желании можно пробовать сличать картинки. Есть такие технологии. Несколько лет назад писали, что Гугль купил у каких-то разработчиков технологию распознования картинок. Задача сложная, но решаемая с определенной вероятностью. Были бы компьютерные ресурсы.

W
На сайте с 18.06.2005
Offline
26
#10
Lor:
Для удаления идеинтичных можно использовать размер файла - хоть на 2 бита, но разные картинки будут отличаться.

Не очень подходит, потому что тогда бы в выдаче было бы несколько масштабированных копий одной и той же фотографии, что собственно и происходит.

Например, нашел по одному запросу сразу 7 вариантов фотки обложки одной и той же книжки. По запросу Bush минимум 2 фотки в двух экземплярах. А если искать логотипы, так те вообще попадаются в десятках вариантов. Хотя, логотипы уж сравнить казалось бы проще простого.

Так что, скорее всего используются только банальные признаки перечисленные Lor'ом. А куча фоток с незаполненым альтом и бессмысленным именем файла и страницы, на которых она размещена просто не попадают в индекс.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий