- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Продаю свою библиотеку для автоматического выделения текстового содержания из произвольных html страниц. Уверен такой сбор контента многим приглянется особенно тем кто работает с дорвея подобными сайтами. Продаю в виде набора библиотек специально что бы упростить интеграцию в различные движки. Чуть подробнее можно прочитать у меня в блоге - http://jeck.ru/universal-content-pasrser-sellin/ . Ещё скажу что это уже третья версия алгоритма доработанная в плане скорости и надежности. Демку можно посмотреть тут - http://4iz.ru/contentparser/ . Если есть вопросы могу ответить тут в личку или по email.
Стоимость 100$.
Неплохо, но дороговато.
Неплохо, но дороговато.
А вы знаете более дешёвые аналоги?
Я не знаю других аналогов. А штука крайне полезная.
она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?
Я не знаю других аналогов. А штука крайне полезная.
Так вот и я не знаю не только более дешёвых, но и вообще каких-либо аналогов этого предложения. Вроде бы как-то давно Noulake писал о чём-то похожем, но не помню, продавал он свой парсер или нет.
>она только парсит? есть настраиваемые параметры? скачивание картинок, умеет убирать ссылки из текста?
У меня есть по каждому из этих вопросов решение, пока я не добавил все это в библиотеку что бы она оставалась легкой. Если это будет необходимо добавлю в течении суток бесплатно. Сейчас кстати ссылки и картинки преобразуются к абсолютному виду.
Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?
Stripe, нет не прикрою, планирую дорабатывать алгоритм (кстати это одна из целей начала продаж). Сейчас продумываю метод склейки близких фрагментов древа и выделение релевантных заголовков к тексту.
Jeck, отсутствие настройки шаблона при парсинге очень заманчивая перспектива. Я надеюсь вы до следующей недели не прикроете продажу?
А в чём престпектива? На выходе обрывки текста, а затраты по времени существенные: 6-7 секунд получение страницы, 1 секунда обработка, итого 50-60 строчек текста (1 статья). Дорвейщикам это не приглянётся.
Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.
ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.
>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.
Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.