Парсер статей.

alexf2000
На сайте с 15.10.2004
Offline
79
#41

Dank0, у меня на блоге на который тут уже ссылались, написано как сделать универсальный парсер. Также готовый раньше продавали на форуме где адверты блокнотика сидят.

Самый интересный SEO-блог (http://alexf.name)
JD
На сайте с 08.12.2006
Offline
72
#42

Какой-то глупый флей развели на пустом месте. Очень неглупый народ всякие xml-лы выдумавает и кучу других протоколов на его основе(а google вообще использует свой) именно потому, что html не годится для передачи информации. Вы хотите решить задачу, которая в практической плоскости не имеет решения. Можно написать более или менее настриаваемый или даже интелектуальный парсер, но слова "любой URL" "любая страница" - это мимо кассы. К сожалению, естественно.

S
На сайте с 13.07.2007
Offline
56
#43
john doe:
Очень неглупый народ всякие xml-лы выдумавает и кучу других протоколов на его основе(а google вообще использует свой) именно потому, что html не годится для передачи информации.

Вы вообще к чему это? Тема про парсинг html страниц, а не про способы передачи информации в сети.

john doe:
Вы хотите решить задачу, которая в практической плоскости не имеет решения.

Пока её не решили - она не имеет решения.

JD
На сайте с 08.12.2006
Offline
72
#44
solnikolay:
Вы вообще к чему это? Тема про парсинг html страниц, а не про способы передачи информации в сети.

А что такое "парсинг статей" как не попытка получить информацию? Парсер получает страницу html в надежде выделить структурную единицу, но формат по определению не позволяет корректно это сделать.

solnikolay:

Пока её не решили - она не имеет решения.

Удачи в изобретении вечного двигателя. Эта проблема пока тоже не решена.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий