GoogleImageFinder - парсер изображений

alexxx_b
На сайте с 10.02.2009
Offline
101
8540

GoogleImageFinder - удобный парсер картинок с сайта images.google.

Отличается высокой скоростью работы и простотой: достаточно ввести запрос из ключевых слов, количество необходимых изображений, нужные форматы, предпочитаемый размер, директорию загрузки изображений и нажать "Старт".

Особенности GoogleImageFinder:

Можно указывать минимальный размер необходимых файлов и количество необходимых картинок.

Импорт запросов из файла.

Опция создания отдельной папки для каждого запроса.

Поддержка фильтров, которые предлагает сам google.

Сохранение названия файлов из описания google.

Можно качать только ссылки, без загрузки самих картинок

Загрузка изображений только с определенного сайта.

В функционал входит мгновенная уникализация скаченных картинок по заданным параметрам.

Прямая ссылка на демо версию Скачать

Страничка программы

Контакты для связи:

icq: 194808413

skype: alexxx_b27

email: alexxx_b@mail.ru

Цена на данный момент $20

H1
На сайте с 26.03.2010
Offline
41
#1

Хорошая программа. Правда ещё бы настроек добавил поболее :)

CB9TOIIIA
На сайте с 22.06.2010
Offline
76
#2

Приобрел программу и еще такую же по Яндексу!

Доволен как слон :) пробовал неделю с CD и парсингом... но в итоге плюнул и написал автору и приобрел GoogleImageFinder и YandexImageFinder (если брать бандл - то скидка есть).

По моей просьбе добавил функционал в экспорт.

Ранее программа экспортировала запрос:имя урла изображения.

Требовалось в локальном формате запрос:имя_сохраненного_изображения.jpg

Что и за несколько часов ввел ТС.

Рекомендую и сам доволен :) кстати порадовал алгоритм программы:

Если по запросу не может взять изображение, пробует взять с другого урла и т.д. т.е. не споткнулся и пошел дальше, а продолжает трудиться как раб)

Пример: http://img-fotki.yandex.ru/get/9767/77677229.70/0_8f42e_3b1697ae_orig.png

Как пожелание сразу иметь чистый экспорт в CSV формате :) (сейчас делается из xls (excel)).

orka13
На сайте с 28.03.2011
Offline
102
#3

Софт еще не купил, но протестировал бетку по полной:

Запустил 20 копий программы с разных каталогов (проц Intel i7-3770K + 16 GB RAM позволили). Загрузил в них списки с ключами, настроил чтобы искало по 20 картинок на ключ и все в одноименную папку с названием ключа сохраняло. Ожидаемый финал – бан гугла где-то на 800-том ключе :).

Встроенный прокси-модуль что-то не работает, не получилось на персональных прокси обойти бан. Но это не беда, - утилитой proxifier настроил каждую копию программы на отдельный прокси при парсинге доменов гугла, а файлы картинок тянуло напрямую.

По такой схеме в минуту успевало обработать ~ 60 ключей (1200 картинок). Но через минут ~30 начинает плавно падать скорость, через 3 часа было уже 10 ключей\минуту. Попускает сразу как очистить полностью журнал (кнопка «Очистить URL). Так что очень бы хотелось что-то типа чек-бокса «авто-очистки URL» или «отключения лога». Я просто сидел и пару раз в час сам очищал, чтобы скорость не падала.

По нагрузкам при такой схеме:

  • Нагрузки на CPU практически нет (10-20% все время), немного поднимается при заполнении лога.
  • А вот RAM под конец забило полностью (1 процесс жрал до 700 мб памяти). Файл подкачки отключен, так как RAM=16 GB. Очистка журнала не помогает, только закрытие процесса программы освобождает память.
  • сеть нагружает на уровне 5-20 мбит\с, в зависимости от падений скорости обработки.

В итоге обработал за сутки 35К ключей = 700 000 картинок = 85 ГБ. Довольный как слон. Так как на подобных парсерах от конкурентов не получалось добиться подобного результата. В основном они страдали сильными нагрузками на и так нехилое железо при попытках ускорить процесс сбора многопоточностью, либо очень часто пропускали часть данных (не парсили ключ до конца, упускали некоторые ключи, даже путали картинки ключей в разных каталогах). Здесь тоже вижу погрешности в виде пустых папок без картинок, но их очень мало (~0,0005 часть).

Продажи шаблона Google-Translate (Гугл Переводчик), скорость: 20 млн ключей/час, с прокси, без API. (http://zennolab.com/discussion/threads/prodazhi-shablona-google-translate.43684/) Переводит ключи, статьи, HTML+PHP файлы (целые сайты, доры) с сохранением верстки!
orka13
На сайте с 28.03.2011
Offline
102
#4

Списался утром с автором, прикупил прогу, он оперативно внес правки в софт, теперь все должно летать даже на высоких нагрузках.

vldkamsin
На сайте с 08.11.2008
Offline
54
#5

Вы о пользователях подумайте, такое кол-во настроек, глаза в кучу.

Раскидайте по вкладкам, сделайте что-то вроде мастера настроек.

P.S. Софт норм

Парсер E-Mail адресов и мобильных номеров (http://samara-weblab.ru/swcontactparser-parsergraber-email-i-mobilnyx-nomerov/) swSpyBrowser – удобный инструмент для SMM и не только (/ru/forum/877362)
22Striker22
На сайте с 13.04.2008
Offline
143
#6

Гоняю софтину уже сутки, полет отличный, парсит довольно шустро и то, что надо.

В общем и целом доволен, свои 20$ точно стоит.

TrueMediaPartner.com (https://truemediapartner.com/signup.php?id=4884). Download ПП + CPA. Более 10.000 офферов и никакого холда. Выплаты в баксах!
CB9TOIIIA
На сайте с 22.06.2010
Offline
76
#7

В чем разница между 5.5 и 5.6 в программе? changelog на сайте старый.

O5
На сайте с 28.02.2012
Offline
101
#8

Купил обе программы (GoogleImageFinder + YandexImageFinder) Работают как часы. Систему не грузят, ошибок не наблюдается. Есть все необходимые настройки. Своих денег однозначно стоят.

Ускорение индексации. (http://tinyurl.com/q5otj3w) Качественный хостинг от 50 р. (http://goo.gl/c1ULnT) Лучшая биржа контента (http://goo.gl/sxl0kL)
getmore
На сайте с 14.02.2008
Offline
106
#9

AVG пишет троян Generic 11_c

Dr.Web версию с Яндекс.Диска в онлайне проверил, все в порядке.

Шаблоны сайтов с Themeforest со скидкой 50%. (https://shopdiz.biz/r/gUJYPm2pH5X-y4hoyhPvIJJ5tTUrOQrA) Клипарты высокого разрешения. WordPress, Joomla, Drupal, Magento, Landing Pages и т.д.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий