Screaming Frog не парсит сайт

ОП
На сайте с 09.07.2018
Offline
0
1168

Доброго времени суток!

Пытаюсь спарсить следующий сайт - https://www.csillium.ru (с остальными работает верно) с помощью Screaming Frog и сканируется только главная страница. В Настройках robots.txt стоит в игноре, чексбоксы в Follow Internal "nofollow" и Follow External "nofollow" также стоят. С чем это может быть связано, подскажите, пожалуйста?

Thommy
На сайте с 06.05.2010
Offline
139
#1

Все парсит вроде:

Или это у вас такой незамысловатый крауд?

sanitarn
На сайте с 20.08.2007
Offline
199
#2
ОксПозд:
Доброго времени суток!
Пытаюсь спарсить следующий сайт - https://www.csillium.ru (с остальными работает верно) с помощью Screaming Frog и сканируется только главная страница. В Настройках robots.txt стоит в игноре, чексбоксы в Follow Internal "nofollow" и Follow External "nofollow" также стоят. С чем это может быть связано, подскажите, пожалуйста?

Если версия 9.4 то нужно отключить в настройках http://prntscr.com/k5nrp7 и будет сканировать.

финансовый ответ (https://finansanswer.ru) Займ для безработных (https://finansanswer.ru/mikrozajmy/bezrabotnym/)
ОП
На сайте с 09.07.2018
Offline
0
#3

Thommy, нет, нет )) У меня и вправду не парсится данный сайт. С остальными всё норм. Выставлены вот такие настройки https://prnt.sc/k820ru.

sanitarn, Limit Crawl Depth был выключен, так что дело не в этом.

seout
На сайте с 31.08.2007
Offline
113
#4

Зайдите в Рендеринг, скорее всего на "текст онли" стоит, а на сайте явно перемудрили с js/ajax. Поставил Олд Аякс краулинг схем, пропарсил сайт

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий