Продам php библиотеку для бесшаблонного парсинга контента

82

Jeck

12 декабря 2009, 15:40

1485

Продаю свою библиотеку для автоматического выделения текстового содержания из произвольных html страниц. Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея подобными сайтами. Продаю в виде набора библиотек специально что бы упростить интеграцию в различные движки. Чуть подробнее можно прочитать у меня в блоге - http://jeck.ru/universal-content-pasrser-sellin/ . Ещё скажу что это уже третья версия алгоритма доработанная в плане скорости и надежности. Демку можно посмотреть тут - http://4iz.ru/contentparser/ . Если есть вопросы могу ответить тут в личку или по email.

Стоимость 100$.

Мой блог (http://jeck.ru)

93

nipler

12 декабря 2009, 17:27

#1

Неплохо, но дороговато.

Быстропост – система автоматической монетизации (http://bystropost.ru/partner/248) Удобный бесплатный инструмент для вебмастера и оптимизатора (http://site-control.ru/)

194

BrokenBrake

12 декабря 2009, 17:40

#2

nipler:
Неплохо, но дороговато.

А вы знаете более дешёвые аналоги?

222

Stripe

12 декабря 2009, 17:46

#3

Я не знаю других аналогов. А штука крайне полезная.

Сайты от 30р почти по любой теме или наполнение ваших сайтов (/ru/forum/887821) дешевым контентом. Базы товаров и контента (http://nakovalnja.ru). Вечные ссылки за 1$ или 30р. (/ru/forum/741397)

S

115

Shadow

12 декабря 2009, 17:50

#4

она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?

194

BrokenBrake

12 декабря 2009, 17:52

#5

Stripe:
Я не знаю других аналогов. А штука крайне полезная.

Так вот и я не знаю не только более дешёвых, но и вообще каких-либо аналогов этого предложения. Вроде бы как-то давно Noulake писал о чём-то похожем, но не помню, продавал он свой парсер или нет.

82

Jeck

12 декабря 2009, 17:58

#6

>она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?

У меня есть по каждому из этих вопросов решение, пока я не добавил все это в библиотеку что бы она оставалась легкой. Если это будет необходимо добавлю в течении суток бесплатно. Сейчас кстати ссылки и картинки преобразуются к абсолютному виду.

Каким плагином для WordPress Google Updates - апдейты Перевёл сайт на HTML5

222

Stripe

12 декабря 2009, 17:58

#7

Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?

82

Jeck

12 декабря 2009, 18:01

#8

Stripe, нет не прикрою, планирую дорабатывать алгоритм (кстати это одна из целей начала продаж). Сейчас продумываю метод склейки близких фрагментов древа и выделение релевантных заголовков к тексту.

225

ewg777

12 декабря 2009, 18:03

#9

Stripe:
Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?

А в чём престпектива? На выходе обрывки текста, а затраты по времени существенные: 6-7 секунд получение страницы, 1 секунда обработка, итого 50-60 строчек текста (1 статья). Дорвейщикам это не приглянётся.

Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея

выделение релевантных заголовков к тексту.

Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

82

Jeck

12 декабря 2009, 18:14

#10

ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.

>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Маркетинг для шоколадной фабрики. На 34% выше средний чек