Вышла новая версия бесплатной программы BatchURLScraper


Бесплатная программа BatchURLScraper предназначена для извлечения данных со страниц сайтов при помощи XPath, CSS-селекторов, XQuery и RegExp.

Основные возможности:

  • Парсинг и извлечение данных по списку URL
  • Гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
  • Модуль для тестирования правил парсинга
  • Возможность использования списков Proxy
  • Экспорт отчетов в Excel (CSV-формат)

Отличия от аналогов:

  • Многопоточность и высокая скорость парсинга
  • Портативный формат (работает без установки на ПК или прямо со сменного носителя)
  • Бесплатное распространение

В  версии 1.3 расширено число страниц для парсинга с 1000 до 5000 URL,  добавлена возможность скрапинга через HTML templates и через внешний и внутренний HTML, а также возможность извлечения данных через атрибуты CSS. 

Скачать новую версию программы можно здесь.

subscribe

Подпишитесь на рассылку SearchEngines

— Статьи мировых экспертов

— Аналитические обзоры

— Важные новости

— Горячие темы с нашего форума

preview Google может продолжать ранжировать страницу после удаления совпадающего контента

Google может продолжать ранжировать страницу после удаления совпадающего контента

Например, при смене названия компании
preview Google: более длинный анкорный текст даёт больше контекста

Google: более длинный анкорный текст даёт больше контекста

Но это не всегда влияет на ранжирование
preview Google: кликботы не помогут улучшить ранжирование

Google: кликботы не помогут улучшить ранжирование

Поэтому использовать их не имеет смысла
preview Возможное обновление поискового алгоритма Google

Возможное обновление поискового алгоритма Google

Изменения зафиксировали инструменты мониторинга SERP
preview В Twitter разгорелась дискуссия об актуальности SEO

В Twitter разгорелась дискуссия об актуальности SEO

В ответ на провокативный пост одного из экспертов отрасли
preview Google не использует данные WHOIS в ранжировании

Google не использует данные WHOIS в ранжировании

И они не влияют на авторитетность или надёжность сайта