BatchURLScraper - Извлечение данных методами XPath, CSSPath и RegExp

1 234
F
На сайте с 20.06.2022
Offline
6
#31

Добрый день. Спасибо за замечательную программу. Вчера столкнулся с проблемой, которую не могу решить самостоятельно.  Не получается вынуть содержимое скрипта - пишу так:

<script id="_DATA_" type="application/json">{text()}</script>

Ответ:  ОШИБКА разбора JSON ответа: Error while parsing text

В этом скрипте есть текст, который мне нужно вынуть:

<script id="_DATA_" type="application/json">   ....thCm":"22.4 cm","heightCm":"22.4 cm"}},"keywords":["blah1", "blah2",  "blah3",  "blah4",  "blah5",  "blah6",  "blah7"],"hasPropertyRelease":false,"hasMod.....  </script>

Нужно вынуть содержимое keywords или хотя бы весь текст скрипта.

Заранее спасибо!

chaser
На сайте с 03.08.2005
Offline
212
#32
falconexem #:

Добрый день. Спасибо за замечательную программу. Вчера столкнулся с проблемой, которую не могу решить самостоятельно.  Не получается вынуть содержимое скрипта - пишу так:

<script id="_DATA_" type="application/json">{text()}</script>

Ответ:  ОШИБКА разбора JSON ответа: Error while parsing text

В этом скрипте есть текст, который мне нужно вынуть:

<script id="_DATA_" type="application/json">   ....thCm":"22.4 cm","heightCm":"22.4 cm"}},"keywords":["blah1", "blah2",  "blah3",  "blah4",  "blah5",  "blah6",  "blah7"],"hasPropertyRelease":false,"hasMod.....  </script>

Нужно вынуть содержимое keywords или хотя бы весь текст скрипта.

Заранее спасибо!

Тут к сожалению не могу помочь
Вы можете попробовать получить код скрипта <script id="_DATA_" type="application/json">...</script> и дальше уже поиском и заменой убрать <script id="_DATA_" type="application/json"> / </script>  и получить json

SiteAnalyzer ( https://site-analyzer.ru/ ) - аналог Screaming Frog | Majento ( https://majento.ru/index.php?page=seo-analize ) - 70+ бесплатных сервисов SEO-аналитики
User
На сайте с 22.02.2023
Offline
0
#33

Добрый день!

Столкнулся с проблемой кодировки получаемого текста. Например, иероглифы в результирующем поле все заменяются на вопросительные знаки "????"

Если в самой ссылке иероглифы можно задать в виде encoded url, то как получить текст HTML без модификации?

Очень прошу помочь, заранее спасибо 😊

chaser
На сайте с 03.08.2005
Offline
212
#34
User #:

Добрый день!

Столкнулся с проблемой кодировки получаемого текста. Например, иероглифы в результирующем поле все заменяются на вопросительные знаки "????"

Если в самой ссылке иероглифы можно задать в виде encoded url, то как получить текст HTML без модификации?

Очень прошу помочь, заранее спасибо 😊

Здравствуйте

Попробуйте SiteAnalyzer - в него встроен подобный модуль

F
На сайте с 20.06.2022
Offline
6
#35
Добрый день! Подскажите, есть ли возможность во встроенном браузере программы поменять масштаб страницы на 25%, т.к. многие сайты стали динамические, и прогружатся сразу не полностью? Заранее спасибо
chaser
На сайте с 03.08.2005
Offline
212
#36
falconexem #:
Добрый день! Подскажите, есть ли возможность во встроенном браузере программы поменять масштаб страницы на 25%, т.к. многие сайты стали динамические, и прогружатся сразу не полностью? Заранее спасибо

Здравствуйте. У программы нет встроенного браузера.
Таким образом, на данный момент, исходный код сайтоы на Ajax для нее не доступен.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий