- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Мы разработали систему для поиска сходных картинок (http://xcavator.net), но у нас нет хорошей базы данных. Можно загружать картинки по запросам с разных сайтов типа flickr.com, но это очень медленно. Похоже что у нас нет альтернативы кроме как завести свою собственную базу с поиском в ней по ключевым словам. Может быть на этом форуме есть специалисты которые могли бы посоветовать как это делать и, может быть, даже написать это дело для нас?
Наша цель на сегодня - 5 миллионов картинок. Насколько я понимаю, все что нужно - это кроулер, поиск ключевых слов в тексте вокруг ссылок на картинки, и SQL база данных. Не так уж сложно казалось бы... Или все намного сложнее?
Сложного точно ничего нет, но:
1) SQL база врядл ли будет хороошим решением, прежде всего в плане масштабируемости. Хотя если дальше 5 млн у вас нет планов двигаться - то решение с базой подойдет.
2) Я не очень понимаю нишу вашего сервиса? Это _тематический_ поиск по картинкам? Т.е. вы захватываете определенную тематику? Или регион? По какм=им критериям отбираются эти 5 млн.
по поводу первого вопроса:
Мне этот модуль не представляется приоритетным на данный момент. Как временное решение SQL сервер сгодится на какое-то время, а затем придется переписывать. Этот модуль изолирован от всего остального, и подменить одну реализацию другой, похоже, не составит труда.
ответ на второй вопрос.
Главная ниша у нас - сервисы для сайтов для фотографов, иллюстраторов, компаний печатающих постеры и т.д. На таких сайтах хранится от сотен тысяч до нескольких миллионов картинок, и когда на текстовый запрос выдается несколько тысяч, понятно, что без контекстного поиска там толком ничего не найдешь. В этом направлении мы в основном и работаем.
Но параллельно мы хотим постепенно проиндексировать всю сеть и предлагать за плату поиск, например, для защиты авторских прав. Ну а также дать бесплатную возможность реально искать картинки простым смертным в удобоваримых подмножествах, определенных ключевыми словами. В частности, находить картинки похожие на набросок нарисованный пользователем. Именно здесь возникают проблемы с кроулером и выделением ключевых слов в тексте. Насколько сложно их написать знающему человеку? Придется ли их писать с нуля, или здесь уже есть готовые решения требующие небольшой доработки?
К сожалению, я не знаю open source решений, которые после небольших доработок можно было бы применить для ваших нужд, там более, что речь идет об интеграции с уже существующей системой.
Давать оценку также вряд ли кто возьмется без рассмотрения уже существующей у вас системы.