Бесплатный парсер контента

12
A
На сайте с 13.07.2009
Offline
8
17049

Может кому пригодится: тут (http://www.makeprosoft.ru) есть неплохой декстопный парсер контента. Причем бесплатный. Функций много и парсер обваляется раз в 2-3 дня, тоесть очень быстро улучшается. Подробнее можете прочитать на сайте.

Bitman
На сайте с 05.07.2009
Offline
112
#1

Хорошо что не в библиотеке :) а ссылка где?

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
xpert13
На сайте с 15.09.2008
Offline
127
#2
Bitman:
Хорошо что не в библиотеке :) а ссылка где?

На слове тут ссылка, только я не понимаю почему так геморно, не уж то проганяете сайт по такому анкору? :D

A
На сайте с 13.07.2009
Offline
8
#3

Сделал ссылку более заметной. Просто не знаю, как вписать ссылку иначе.

[Удален]
#4

Интересно.

bolyk
На сайте с 16.02.2006
Offline
175
#5

Уважаемый автор, а можно ли с помощу вашей программы парсить список сайтов, или список отдельных страниц одного сайта?

Thunder v3. Дорген (http://ifirestarter.ru/product/10) | MassSiteProxy. Скрипт клонирования сайтов (http://ifirestarter.ru/product/12) | CPAgen CPA дорген (http://ifirestarter.ru/product/14) | (http://fast-index.ru/article)
jcrush
На сайте с 04.07.2004
Offline
371
#6

Опишите что умеет, а то парсеров много а толк не всегда есть

» Блог (http://blog.stfw.ru/) - SEO-заметки. ДВчат: @dvchat (https://t.me/dvchat)
S
На сайте с 31.03.2009
Offline
15
#7

На сайте все написано, читай новость

"Версия 2.2"

там список всех функций!

[Удален]
#8
Уважаемый автор, а можно ли с помощу вашей программы парсить список сайтов, или список отдельных страниц одного сайта?

Врятли. Она больше по блогам ориентирована. Если этот ваш сайт является блогов-тогда да. Можно спарсить весь блог целиком или указанные страницы блогов по списку. Список функций, раз вам так удобнее:

Список функций:
1.Парсинг по заданному слову или выражению. Результаты можно сортировать по дате публикации или по релевантности. При этом при сортировке по дате результаты более тематические.
2. Парсинг статей заданной категории. При этом парсятся только статьи указанной категории или метки.
3.Экспорт в отдельные html файлы, rss ленту или html файл для дальнейшего импорта в zebroid или WPT, или в формат из шаблона.
4.Парсить можно популярные блоги, блоги целиком(статьи и комментарии из блогов), записи из блогов, записи из микроблогов, коментарии из блогов и микроблогов, форумы, все блоги и форумы.
5.Можно парсить определенный сервис(livejournal и т.п.) или даже отдельный блог.
6. Функция замены слов в тексте.(Файл replace.txt в папке парсера. Для замены слова “пользователь” на “читатель” добавте туда строку “пользователь=читатель”, без кавычек.). Замена просиходит через регулярные выражения, что дает неограниченое пространство корректировки текста.
7.Рядом с каждой функцией есть знак вопроса, при нажатии на который вы получите краткую справку.
8. Удаление повторов. Парсер автоматически удаляет 90% повторных статей в случае если одна статья размещена на нескольких сервисах.(Присутствует с версии 1.1)
9.Добавлены стоп слова.(Файл stop_slova.txt в папке парсера. Писать надо по одному слову в строке. Если одно из этих слов встречается в тексте статьи то статья не сохраняется. Регистр значения не имеет. )
10.Можно парсить по собраному списку url статей, или запросов.
11. Можно указать лимит постов.
12. Есть предпросмотр постов позволяющий вручную отбирать подходящие посты. Показывает вид как в браузере, со ссылками и картинками, и чистый код стать который можно менять.
13. Автоматическая синонимизация текстов внутри парсера. Работает достаточно быстро и качественно. Есть синонимизация через сервер. Работает на очень неплохом уровне.
14. Автоматическое удаление указанных тегов.
15. Работа с прокси.
16. Поддержка профайлов. Это позволяет разбивать длинный парсинг на несколько этапов а также нет необходимости каждый раз настраивать парсер.
17. Можно разбивать текст на предложения и перемешивать. Это помогает уникализировать текст.
18.Опциональное добавление беклинка на источник, который в любом случе будет виден для поисковиков(даже если в парсере указать добавление к ссылкам).
19.Удобный и понятный интерфейс.
20.Сохранение последних настроек.
21.Встроенный генератор дорвеев.
22. Можно для каждого запроса указать количество обрабатываемых страниц базы. Это очень полезно при парсинге по списку.
A
На сайте с 13.07.2009
Offline
8
#9

Пояснить-Abiron автор проги. Я только решил с вами поделиться.

zxcore
На сайте с 12.03.2008
Offline
38
#10

Основное назначение программы - генерация сплогов из чужих блогов?

Йа афрооптимизатор :)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий