Продам php библиотеку для бесшаблонного парсинга контента

12
Bitman
На сайте с 05.07.2009
Offline
112
#11

Алгоритм работы парсера в секрете?

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
Jeck
На сайте с 20.07.2006
Offline
82
#12

>Алгоритм работы парсера в секрете?

Да, после покупки могу все объяснить если есть желание.

Мой блог (http://jeck.ru)
K
На сайте с 11.10.2008
Offline
102
kep
#13

Это чтото типа этого

Вы очищаете html от ненужных блоков и забираете то что останется или распознаете блок с текстом?

Jeck
На сайте с 20.07.2006
Offline
82
#14

kep, у меня эта программа ничего кроме ошибок не выводит. Я не очищаю html, совсем другой принцип.

K
На сайте с 11.10.2008
Offline
102
kep
#15

Я сейчас что то подобное пишу, тупо ищу самый большой div и забираю текст. пока вроде работает.

Продаете библиотеку с исходниками?

alexf2000
На сайте с 15.10.2004
Offline
79
#16

Что-то я в демке жму кнопку, а ничего не происходит.

Самый интересный SEO-блог (http://alexf.name)
Jeck
На сайте с 20.07.2006
Offline
82
#17

kep, да для личного использования.

alexf2000, проблемы с сетью у FirstVDS (крайне не советую) работает медленно попробуйте ещё раз http://4iz.ru/contentparser/?url=http://jeck.ru .

[Удален]
#18
Jeck:
ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.

>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.

Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.

Да, несколько месяцев назад писал такое ради эксперимента. В большинстве случаев текст и заголовки выделяло правильно. Складывало в текстовые файлы. Только эксперимент провалился, а в самостоятельной ценности такого скрипта я уверен не был. А Вы на php пишете?

Jeck
На сайте с 20.07.2006
Offline
82
#19

autosubmit, да я пишу на php по большей части.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий