lahesis333

Рейтинг
1
Регистрация
29.03.2022
Виктор Петров #:

Вам бы на перспективу разобраться с XPath, XSLT и вот этим всем. В парсинге всерьёз без этого никуда.

Спасибо на добром слове и совете! Но, если честно, в моем случае парсинг сайта медикаментов это исключительно разовая акция. Мне всего то и нужно было так это поиметь некоторые параметры товаров для использования в повседневной работе(сортировке лекарств).  Но , насколько я понял, тут не любят таких "умников"(это я про себя), которым сразу все подавай разжеванным(а где то любят?) и в готовом виде. Типа "мы мучались-разбирались, теперь твоя очередь"

Вообщем вроде немного разобрался(в смысле есть хоть что то). Карточки товара находит, но все равно не выдает нужные мне значения(производителя товара).
jpg z3zabhltfljg.jpg
jpg 1kneu8wj6g9f2.jpg
jpg cooy4i5mosug3.jpg
JOHNY2010 #:
Бывает аналогичный баг, что лягушка не хочет собирать информацию, проходит путем закрытия-открытия софта пару раз.

Та я в принципе в этом вопросе не шарю)) Делаю так как на скринах. Может что то в настройках нужно изменить?

jpg 61n234ll8cci.jpg
jpg c50lp1f9nr7j2.jpg
jpg kkmbk2589y1t3.jpg
Onecontent #:

По картам бежит только в путь. 

А можно попросить ваш запрос в custom extraction? Просто у меня не находит тех результатов что у вас на скрине. 

Попал таки на карту сайта.

Все строчки имеют практически идентичное название и выглядят вот так 

<sitemap>
<loc>https://www.eapteka.ru/upload/eapteka_sitemap/sitemap_ssl_sections_056.xml</loc>
<lastmod>2022-03-28T13:06:45+03:00</lastmod>

Как это ни странно, но нет такого пункта...

png 6spk3fwnm9r_2022-03-29_140730.png