Поиск картинок

L
На сайте с 04.08.2006
Offline
0
1329

Мы разработали систему для поиска сходных картинок (http://xcavator.net), но у нас нет хорошей базы данных. Можно загружать картинки по запросам с разных сайтов типа flickr.com, но это очень медленно. Похоже что у нас нет альтернативы кроме как завести свою собственную базу с поиском в ней по ключевым словам. Может быть на этом форуме есть специалисты которые могли бы посоветовать как это делать и, может быть, даже написать это дело для нас?

Наша цель на сегодня - 5 миллионов картинок. Насколько я понимаю, все что нужно - это кроулер, поиск ключевых слов в тексте вокруг ссылок на картинки, и SQL база данных. Не так уж сложно казалось бы... Или все намного сложнее?

E
На сайте с 27.08.2005
Offline
15
#1

Сложного точно ничего нет, но:

1) SQL база врядл ли будет хороошим решением, прежде всего в плане масштабируемости. Хотя если дальше 5 млн у вас нет планов двигаться - то решение с базой подойдет.

2) Я не очень понимаю нишу вашего сервиса? Это _тематический_ поиск по картинкам? Т.е. вы захватываете определенную тематику? Или регион? По какм=им критериям отбираются эти 5 млн.

L
На сайте с 04.08.2006
Offline
0
#2

по поводу первого вопроса:

Мне этот модуль не представляется приоритетным на данный момент. Как временное решение SQL сервер сгодится на какое-то время, а затем придется переписывать. Этот модуль изолирован от всего остального, и подменить одну реализацию другой, похоже, не составит труда.

ответ на второй вопрос.

Главная ниша у нас - сервисы для сайтов для фотографов, иллюстраторов, компаний печатающих постеры и т.д. На таких сайтах хранится от сотен тысяч до нескольких миллионов картинок, и когда на текстовый запрос выдается несколько тысяч, понятно, что без контекстного поиска там толком ничего не найдешь. В этом направлении мы в основном и работаем.

Но параллельно мы хотим постепенно проиндексировать всю сеть и предлагать за плату поиск, например, для защиты авторских прав. Ну а также дать бесплатную возможность реально искать картинки простым смертным в удобоваримых подмножествах, определенных ключевыми словами. В частности, находить картинки похожие на набросок нарисованный пользователем. Именно здесь возникают проблемы с кроулером и выделением ключевых слов в тексте. Насколько сложно их написать знающему человеку? Придется ли их писать с нуля, или здесь уже есть готовые решения требующие небольшой доработки?

E
На сайте с 27.08.2005
Offline
15
#3

К сожалению, я не знаю open source решений, которые после небольших доработок можно было бы применить для ваших нужд, там более, что речь идет об интеграции с уже существующей системой.

Давать оценку также вряд ли кто возьмется без рассмотрения уже существующей у вас системы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий