Посоветуйте HTML-парсер

A
На сайте с 26.11.2007
Offline
37
1139

Уважаемые Гуру,

посоветуйте пожалуйста парсер HTML кода, написанный на php.

хотелось бы бесплатный...

писать самому - нереально... цейтнот...

Перебрал несколько вариантов, которые смог найти в гугле и в яше.

пока ни на чём не остановился...

причины следующие:

- некоторые написаны откровенно школьниками... или написаны как пример к учебнику (слишком просты, даже теги не все распознают)... да, эти парсеры написаны для работы с HTML, но в качестве функционала - либо одна функция которая что-либо выдёргивает или что-либо заменяет в коде HTML или что-то подобное... по идее такие скрипты и на "парсер" то не тянут...

- некоторые слишком долго работают... так, например, на хосте разбор HTML-кода из 20-30к символов занимает около 5-10 секунд (фактически максимальная нагрузка на хост) - в зависимости от вложенности тегов, что в принципе для меня не допустимо... никакой хостер не согласится меня держать с таким парсером... выделенный сервер - мягко скажем жирновато для парсера

Хотелось бы видеть примерно следующее:

- php-скрипт, построенный на классах;

- разборка html-кода по тегам и вывод результатов в многоуровневый массив с параметрами каждого тега;

- сборка html-кода из массива;

- желательна высокая скорость работы;

или хотя бы подскажите в какую сторону рыть...

заранее благодарен.

Alweb добавил 12.08.2009 в 19:47

PHP-парсер HTML-кода

так правильнее

Консультации по Drupal (http://www.alweb.ru). Разработка и оптимизайция сайтов на CMF Drupal.
ewg777
На сайте с 04.06.2007
Offline
225
#1

А что парсить желаете или просто чтобы был? Какой-то конкретный сайт? Что значит просто html-код? Быть может нужен универсальный парсер, то это уже есть - http://hell.helldude.ru/archives/81

A
На сайте с 26.11.2007
Offline
37
#2

ewg777, HTML-код парсить... что же ещё можно таким парсером парсить...

конкретных сайтов нет... парсить сайт особого ума не надо, и труда не составит...

скрипты, которыми наводнён инет с названиями "парсер" - это не парсеры по большому счёту...

их можно назвать "выкусыватели" нужного слова, буквы, фразы и т.д...

универсальный парсер также мне не нужен.

нужен именно html-парсер, задействующий полную спецификацию html...

стоит задача разобрать html на винтики, сделать некие преобразования, затем собрать обратно в страничку.

вот и все дела... некий такой конструктор...

Ghost Bear
На сайте с 01.07.2009
Offline
28
#3
Пишу продвинутый веб-софт и автоматизирую сео-задачи на партнёрских условиях. Ваша тема + Мой код = Совместный успех. Велком в ЛС.
A
На сайте с 26.11.2007
Offline
37
#4

Ghost Bear, спасибо, смотрел уже на него...

подошёл бы он наверное... да вот DOM'а на хосте нету...

нужно с использованием голого php...

может есть подобная DOM'у альтернатива?

[Удален]
#5

phpquery тебе понравится, как раз для лентяев вещица, но скорость работы я бы сказал что грешит :)

LX
На сайте с 11.06.2007
Offline
28
#6

Обязательно php?

Если нет, то покурите http://search.cpan.org/~gaas/HTML-Parser-3.61/Parser.pm

Вставит ого-го! 🚬

Ѣ-программисты пишут на Petrovich (http://2lx.ru/2009/05/yazyk-programmirovaniya-petrovich/) и Ook! (http://2lx.ru/2009/06/yazyk-programmirovaniya-ook/) Нечего кушать? Подои Зорьку (http://zorkabiz.ru/?zorka=1071)! Мууу...
[Удален]
#7

Le)(x, перл вообще вставляет огого ...

A
На сайте с 26.11.2007
Offline
37
#8

эх... вставляет...

вот только php никак не вставляет...

к сожалению с перлом вообще никак пока.

уже 4 часа рою... что-то никак.

по всей видимости хост с ДОМом нужно брать.

крутовато как-то хост менять ради парсера...

[Удален]
#9
Alweb:
эх... вставляет...
вот только php никак не вставляет...
к сожалению с перлом вообще никак пока.

уже 4 часа рою... что-то никак.
по всей видимости хост с ДОМом нужно брать.
крутовато как-то хост менять ради парсера...

купите в firstvds.ru pf 150 рублей и не устраивайте из мехи слона

A
На сайте с 26.11.2007
Offline
37
#10
bearman:
купите в firstvds.ru pf 150 рублей и не устраивайте из мехи слона

не всё так просто...

купил бы уже давно...

если бы не ограничения по моему проекту, наврядли стал бы искать парсер на голом php...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий