Вопрос к гуру парсеров: можно ли спарсить такое?

regta
На сайте с 15.04.2006
Offline
320
786

Уж больно топонимическая и адресная база хорошая, выверенная

В коде - js и jquery

ХЗ, может удалят завтра страницу

http://www.cikrf.ru/services/lk_address/?do=address

Цитируйте, плиз, историю переписки в личке. Спасибо.
R
На сайте с 31.08.2010
Offline
78
#1

Можно. В коде

<a class="jstree-anchor" href="#" intid="146896829180935680000375022" levelid="7"><i class="jstree-icon jstree-themeicon"></i>Фрунзе улица</a>
<a class="jstree-anchor jstree-clicked" href="#" intid="135637827259064320000372178" levelid="4" ret="1"><i class="jstree-icon jstree-themeicon"></i>Город Санкт-Петербург</a>

Спарсить не проблема.

Maxim-KL
На сайте с 26.01.2011
Offline
350
#2

А просто все выкачать к примеру при помощи TeleportPro не вариант?

Мои услуги по прогонам: ✅Качественный ручной статейный прогон по базе сайтов с ИКС10+ (maximgroups.net/progon-statejnyj) ✅Прогон Максимум - Все включено, 300+ качественных ссылок (maximgroups.net/progon-maksimum)
Solmyr
На сайте с 10.09.2007
Offline
501
#3

Данных много. На четвертом уровне вложенности - уже 127000 строк.

S1
На сайте с 17.04.2011
Offline
79
#4

Проще скачать ФИАС. 2000 городов и ПГТ, около 200 тыс. деревень и сел, 1,2 млн. улиц, 32 млн. домов.

eis
На сайте с 18.10.2008
Offline
473
eis
#5

regta, можно спарсить ☝

- Здесь я покупаю вечные ссылки на свои сайты! (https://backlinkator.com) - сотни ссылок за копейки
S1
На сайте с 15.09.2016
Offline
9
#6

Все что отображается в браузете - можно спасить. В крайнем случае можно использовать PhantomJS.

SEO анализ сайта (https://seo11.ru/)
PA
На сайте с 12.02.2016
Offline
24
#7

И зачем такие сложности? разбор хтмл-а, телепорт, фантом...

Там все замечательно забирается джейсоном. Отдаются уже структурированные данные, не нужно выковыривать их как в случае с хтмл.

первый запрос:
http://www.cikrf.ru/services/lk_tree/?first=1&id=%23
потом из джейсона достаем id-шки и сохраняем в базу
дергаем каждую id-шку, например:
http://www.cikrf.ru/services/lk_tree/?id=6434118731
сохраняем новые id-шки и повторяем пока не вытащим все.
. . .

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий