Бесплатная программа BatchURLScraper предназначена для извлечения данных со страниц сайтов при помощи XPath, CSS-селекторов, XQuery и RegExp.
Основные возможности:
- Парсинг и извлечение данных по списку URL
- Гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
- Модуль для тестирования правил парсинга
- Возможность использования списков Proxy
- Экспорт отчетов в Excel (CSV-формат)
Отличия от аналогов:
- Многопоточность и высокая скорость парсинга
- Портативный формат (работает без установки на ПК или прямо со сменного носителя)
- Бесплатное распространение
В версии 1.3 расширено число страниц для парсинга с 1000 до 5000 URL, добавлена возможность скрапинга через HTML templates и через внешний и внутренний HTML, а также возможность извлечения данных через атрибуты CSS.
Скачать новую версию программы можно здесь.