Продам php библиотеку для бесшаблонного парсинга контента

12
Jeck
На сайте с 20.07.2006
Offline
82
1459

Продаю свою библиотеку для автоматического выделения текстового содержания из произвольных html страниц. Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея подобными сайтами. Продаю в виде набора библиотек специально что бы упростить интеграцию в различные движки. Чуть подробнее можно прочитать у меня в блоге - http://jeck.ru/universal-content-pasrser-sellin/ . Ещё скажу что это уже третья версия алгоритма доработанная в плане скорости и надежности. Демку можно посмотреть тут - http://4iz.ru/contentparser/ . Если есть вопросы могу ответить тут в личку или по email.

Стоимость 100$.

Мой блог (http://jeck.ru)
nipler
На сайте с 04.07.2008
Offline
93
#1

Неплохо, но дороговато.

Быстропост – система автоматической монетизации (http://bystropost.ru/partner/248) Удобный бесплатный инструмент для вебмастера и оптимизатора (http://site-control.ru/)
BrokenBrake
На сайте с 03.03.2007
Offline
194
#2
nipler:
Неплохо, но дороговато.

А вы знаете более дешёвые аналоги?

Stripe
На сайте с 05.09.2006
Offline
222
#3

Я не знаю других аналогов. А штука крайне полезная.

Сайты от 30р почти по любой теме или наполнение ваших сайтов (/ru/forum/887821) дешевым контентом. Базы товаров и контента (http://nakovalnja.ru). Вечные ссылки за 1$ или 30р. (/ru/forum/741397)
S
На сайте с 10.08.2006
Offline
115
#4

она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?

BrokenBrake
На сайте с 03.03.2007
Offline
194
#5
Stripe:
Я не знаю других аналогов. А штука крайне полезная.

Так вот и я не знаю не только более дешёвых, но и вообще каких-либо аналогов этого предложения. Вроде бы как-то давно Noulake писал о чём-то похожем, но не помню, продавал он свой парсер или нет.

Jeck
На сайте с 20.07.2006
Offline
82
#6

>она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?

У меня есть по каждому из этих вопросов решение, пока я не добавил все это в библиотеку что бы она оставалась легкой. Если это будет необходимо добавлю в течении суток бесплатно. Сейчас кстати ссылки и картинки преобразуются к абсолютному виду.

Stripe
На сайте с 05.09.2006
Offline
222
#7

Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?

Jeck
На сайте с 20.07.2006
Offline
82
#8

Stripe, нет не прикрою, планирую дорабатывать алгоритм (кстати это одна из целей начала продаж). Сейчас продумываю метод склейки близких фрагментов древа и выделение релевантных заголовков к тексту.

ewg777
На сайте с 04.06.2007
Offline
225
#9
Stripe:
Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?

А в чём престпектива? На выходе обрывки текста, а затраты по времени существенные: 6-7 секунд получение страницы, 1 секунда обработка, итого 50-60 строчек текста (1 статья). Дорвейщикам это не приглянётся.

Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея
выделение релевантных заголовков к тексту.

Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

Jeck
На сайте с 20.07.2006
Offline
82
#10

ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.

>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий