Продам php библиотеку для бесшаблонного парсинга контента

Jeck · 2026-07-01T11:07:18.0000000Z

Продаю свою библиотеку для автоматического выделения текстового содержания из произвольных html страниц. Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея подобными сайтами. Продаю в виде набора библиотек специально что бы упростить интеграцию в различные движки. Чуть подробнее можно прочитать у меня в блоге - http://jeck.ru/universal-content-pasrser-sellin/ . Ещё скажу что это уже третья версия алгоритма доработанная в плане скорости и надежности. Демку можно посмотреть тут - http://4iz.ru/contentparser/ . Если есть вопросы могу ответить тут в личку или по email. Стоимость 100$.

112

Bitman

12 декабря 2009, 20:05

#11

Алгоритм работы парсера в секрете?

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)

82

Jeck

12 декабря 2009, 20:08

#12

>Алгоритм работы парсера в секрете?

Да, после покупки могу все объяснить если есть желание.

Мой блог (http://jeck.ru)

K

102

kep

12 декабря 2009, 20:20

#13

Это чтото типа этого

Вы очищаете html от ненужных блоков и забираете то что останется или распознаете блок с текстом?

82

Jeck

12 декабря 2009, 20:50

#14

kep, у меня эта программа ничего кроме ошибок не выводит. Я не очищаю html, совсем другой принцип.

K

102

kep

12 декабря 2009, 20:57

#15

Я сейчас что то подобное пишу, тупо ищу самый большой div и забираю текст. пока вроде работает.

Продаете библиотеку с исходниками?

79

alexf2000

12 декабря 2009, 21:37

#16

Что-то я в демке жму кнопку, а ничего не происходит.

Самый интересный SEO-блог (http://alexf.name)

82

Jeck

13 декабря 2009, 05:56

#17

kep, да для личного использования.

alexf2000, проблемы с сетью у FirstVDS (крайне не советую) работает медленно попробуйте ещё раз http://4iz.ru/contentparser/?url=http://jeck.ru .

[Удален]

13 декабря 2009, 13:32

#18

Jeck:
ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.

>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.

Да, несколько месяцев назад писал такое ради эксперимента. В большинстве случаев текст и заголовки выделяло правильно. Складывало в текстовые файлы. Только эксперимент провалился, а в самостоятельной ценности такого скрипта я уверен не был. А Вы на php пишете?

Rewarded блок РСЯ - Резкий всплеск прямых заходов. Продвижение по инфо-запросам

82

Jeck

13 декабря 2009, 18:16

#19

autosubmit, да я пишу на php по большей части.

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Яндекс Вебмастер вынес товарные фиды в отдельный раздел