Парсер статей.

Dank0 · 2008-08-03T09:55:11.0000000Z

Вопрос такой есть ли уже готовые продукты подобного рода, которые при подаче на вход скрипта html страницы на выходе дают статью находящуюся на ней, без мусора и всякого рода дребедени? Есть ли бесплатные вещи подобного рода или проще написать свой, если да может ктонибудь поделится алгоритмом??? 8)

79

alexf2000

5 августа 2008, 16:13

#41

Dank0, у меня на блоге на который тут уже ссылались, написано как сделать универсальный парсер. Также готовый раньше продавали на форуме где адверты блокнотика сидят.

Самый интересный SEO-блог (http://alexf.name)

JD

72

john doe

6 августа 2008, 04:10

#42

Какой-то глупый флей развели на пустом месте. Очень неглупый народ всякие xml-лы выдумавает и кучу других протоколов на его основе(а google вообще использует свой) именно потому, что html не годится для передачи информации. Вы хотите решить задачу, которая в практической плоскости не имеет решения. Можно написать более или менее настриаваемый или даже интелектуальный парсер, но слова "любой URL" "любая страница" - это мимо кассы. К сожалению, естественно.

S

56

solnikolay

6 августа 2008, 07:30

#43

john doe:
Очень неглупый народ всякие xml-лы выдумавает и кучу других протоколов на его основе(а google вообще использует свой) именно потому, что html не годится для передачи информации.

Вы вообще к чему это? Тема про парсинг html страниц, а не про способы передачи информации в сети.

john doe:
Вы хотите решить задачу, которая в практической плоскости не имеет решения.

Пока её не решили - она не имеет решения.

JD

72

john doe

6 августа 2008, 16:51

#44

solnikolay:
Вы вообще к чему это? Тема про парсинг html страниц, а не про способы передачи информации в сети.

А что такое "парсинг статей" как не попытка получить информацию? Парсер получает страницу html в надежде выделить структурную единицу, но формат по определению не позволяет корректно это сделать.

solnikolay:

Пока её не решили - она не имеет решения.

Удачи в изобретении вечного двигателя. Эта проблема пока тоже не решена.

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Яндекс Вебмастер вынес товарные фиды в отдельный раздел