HTML-парсеры

lagif
На сайте с 15.12.2004
Offline
30
921

в свое время пришлось парсер писать самой. не то, чтоб супер получилось, но мне много не надо.

все парсеры, что мне попадались - очень заморачиваются на правильности тэгов. хотя, выслушаю все предложения насчет сишных библиотек.

(скажу сразу, libxml не понравилась :) )

Это тоже пройдет...
VT
На сайте с 27.01.2001
Offline
130
#1

Небольшое замечание - этот вопрос не для раздела о поисковых технологиях. Переношу.

Ayavryk
На сайте с 11.10.2003
Offline
209
#2
Как писал lagif очень заморачиваются на правильности тэгов

А если перед парсингом пропустить через putty?

Тынгыр, мынгыр, комсомол (http://erum.ru). Ехари, ехари, (жалобно) аяврик. /народная тунгусская песня/
lagif
На сайте с 15.12.2004
Offline
30
#3

Ayavryk,

Помогает через раз...

LM
На сайте с 30.11.2001
Offline
71
LiM
#4

Vyacheslav Tikhonov,

Лучше б в "Самое разное" кинул - там он, ИМХО, уместнее...

Ну да пусть здесь будет - не принципиально :)

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
Freem
На сайте с 03.12.2004
Offline
86
#5

Вопрос от новичка:

Что есть HTML-парсеры?

Прошу прощения за небольшой оффтоп :)

[Удален]
#6

Похоже облом.

Придется Яву учить. ;)

LM
На сайте с 30.11.2001
Offline
71
LiM
#7
Что есть HTML-парсеры?

Программы, которые "разбирают" HTML-код на "винтики" и его анализируют, индексируют, преобразуют... В общем, это основа почти всех программ, которые так или иначе обрабатывают HTML-страницы. Например, индексирующих роботов.

Interitus,

Ну, можно и не Яву... С++ для крутых поисковиков, или Perl, PHP, ASP - для web-сервисов или мелких поисковичков. Ява, ИМХО, только для web-сервисов годится... да и то, не очень удобна она в этом амплуа.

lagif
На сайте с 15.12.2004
Offline
30
#8

Ы-ым... ява - штука не та, наверняка... на сях быстрей. Ну, и скриптовые языки - тоже не то :) Хотя, кого-то и могут соблазнить обилием нужных функций.

LM
На сайте с 30.11.2001
Offline
71
LiM
#9

lagif,

Каждый язык хорош для своего. И скриптовые парсеры порой очень полезны. Вот, например, я для одного своего сервиса его недавно попользовал... Ну зачем писать парсер на сях, когда весь сервис на PHP?..

lagif
На сайте с 15.12.2004
Offline
30
#10
Как писал LiM
lagif,
...Ну зачем писать парсер на сях, когда весь сервис на PHP?..

И правда :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий