Парсинг средствами php страниц, полностью состоящих из Java

c12o16h1
На сайте с 01.09.2009
Offline
77
951

Собственно есть нужда попарсить некоторый ресурс, который отдает только Java код. Но в броузере естественно выглядит все прелестно.

Если вырубить в броузере поддержку джава - сервак отдает данные нормально (ну насколько мне видно).

Вопрос в том, как можно передать серверу правильный хедер (в curl), чтобы он понял что его запрашивает броузер без поддержки джава и отдал нормальную страницу, а не набор скриптов.

Заранее спасибо.

Моментальный вывод Webmoney в Украине (http://obmennik.ws/?r=id.4780)
D
На сайте с 14.01.2007
Offline
153
#1

ну для начала javaSCRIPT!!!

потом: поставьте что-нибудь для отслеживания хэдеров(HTTPLiveHeaders для ФФ например). ну и JSON гораздо проще парсить чем чистый HTML

c12o16h1
На сайте с 01.09.2009
Offline
77
#2
Dinozavr:
ну для начала javaSCRIPT!!!
потом: поставьте что-нибудь для отслеживания хэдеров(HTTPLiveHeaders для ФФ например). ну и JSON гораздо проще парсить чем чистый HTML

А как это относится к сабжу?

Mad_Man
На сайте с 10.11.2008
Offline
162
#3
c12o16h1:
А как это относится к сабжу?

Сходите на форум Javascript'a и назовите их язык Java. Если не бан сразу, то уж точно постов 20 ненависти.

[Удален]
#4

К сабжу это относится напрямую, если только речь идёт не о Java-апплетах, которые, если я не ошибаюсь, никакой код не отдают. А алгоритм действий Вам уже расписали, осталось только его выполнить;)

defaul
На сайте с 18.01.2009
Offline
22
#5
Если вырубить в броузере поддержку джава - сервак отдает данные нормально (ну насколько мне видно).

Если вы отрубаете js и у вас всё отображается то зачем искать что-то, парсите html)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий