RiveSolutions SEO Spider

AA
На сайте с 22.05.2018
Offline
15
#11

iskrakovrov, нет, Вы ошиблись.

Мы никогда не собирали деньги на разработку.

Все из своего кармана.

---------- Добавлено 14.06.2018 в 09:31 ----------

iskrakovrov, по поводу ошибки установки: да, известная на сей день проблема.

В данном случае можно просто нажать кнопку пропустить. Ошибка вызвана тем, что при установке программы, надо также установить и соответствующие редистрибутивы, которые у Вас уже установлены. Вот и вываливается эта ошибка.

Пропуск в данном случае ни на что не влияет. Работаем сейчас и над этим.

AA
На сайте с 22.05.2018
Offline
15
#12

burunduk,

1. сколько потоков поддерживает парсер?

- сейчас количество потоков регулируется автоматически, а именно, берется количество ядер Вашего процессора и на каждое логическое ядро создается отдельный поток. Пока что, мы считаем это оптимальным, ибо увеличение потоков может привести к зависанию всей системы, если переборщить конечно.

2. возможно ли настроить время ожидания ответа?

- что Вы имеете ввиду? Если ограничить таймаут - будет доступно это. Сейчас есть только заглушка на странице настроек Settings => Limits Settings (см. скриншот). Все никак до этого руки не доходили.

3. поддерживаются ли пакеты прокси?

- есть возможность задать соединение через прокси на странице настроек Settings => Proxy Settings.

4. есть ли поиск по фрагментам кода?

- именно по кускам HTML кода? Нет, нету. Нужно ли это? Может достаточно будет только поиска по XPath?

5. какой объём занимает в оперативке сайт с 1000к+ документами?

- честно говоря, не проверяли.

png unknown1.png
png unknown2.png
AA
На сайте с 22.05.2018
Offline
15
#13

burunduk, и на счет русского языка, да, Вы уже не первый, кто ткнул нас носом в это. Сделаем.

https://trello.com/c/NjOhwAnA/89-translate-program-to-russian-language

S
На сайте с 25.11.2008
Offline
124
#14

Оффтоп, но интересно стало. А на чем ведете разработку? Какой стек технологий используете?

Бесплатные виджеты для сайта (https://pfka.ru). Технический анализ сайта ( https://linkonavt.ru/services/sitetechnologies ).
AA
На сайте с 22.05.2018
Offline
15
#15
sslab:
Оффтоп, но интересно стало. А на чем ведете разработку? Какой стек технологий используете?

Язык программирования - С++

Для GUI и для работы с сетью - фреймворк Qt.

Для тестирования - фреймворк google test

Для парсинга html - сначала использовали гугловскую библиотеку gumbo, но она оказалась слишком тормознутой, переехали на myhtml (http://lexborisov.github.io/benchmark-html-persers/)

Ну и для работы с Excel используем расширение для Qt - QtXlsxWriter (https://github.com/dbzhang800/QtXlsxWriter)

Также и не обошлось без WinAPI - это причина, по которой мы не можем сразу сделать сборки для Mac OS. Но позже будут и они.

vold57
На сайте с 01.10.2007
Offline
261
#16

AndrAscii, сколько будет стоить программа?

Аудит сайтов - главная часть это тщательная ручная работа, а не отчеты сервисов и программ (https://vold57.com/audit). Продвижение сайтов (https://vold57.com/seo)
AA
На сайте с 22.05.2018
Offline
15
#17
vold57:
AndrAscii, сколько будет стоить программа?

По крайней мере в самом начале:

Для стран СНГ - 60$, что примерно 3700 рублей за подписку в год.

Для стран Запада - 100$ за подписку в год.

На данный момент можно сделать предзаказ на 2 года вперед за 100$.

Но я Вам настоятельно рекомендую для начала попользоваться программой какое-то время, чтобы убедиться, что то, что мы предлагаем, Вам действительно подходит.

Мы, в свою очередь постараемся сделать Все, чтобы она Вам подошла. =)

В целом, мы готовы выслушать Ваши предложения по улучшению.

SmileP
На сайте с 18.02.2010
Offline
386
#18
AndrAscii:
6. Временная переадресация 302 (Moved Temporarily 302) - ссылки с 302 кодом.
7. Перманентные переадресации 301 (Moved Permanently 301)

Цели редиректов обрабатываются?

AA
На сайте с 22.05.2018
Offline
15
#19
SmileP:
Цели редиректов обрабатываются?

Можно чуть-чуть подробнее? Не совсем понял, что значит обрабатываются?

---------- Добавлено 14.06.2018 в 13:04 ----------

SmileP, желательно еще пример идеальной обработки

[Удален]
#20
AndrAscii:
сейчас количество потоков регулируется автоматически, а именно, берется количество ядер Вашего процессора и на каждое логическое ядро создается отдельный поток

значит спарсить большой сайт будет практически невозможно - тупо не хватит терпения дождаться

AndrAscii:
- есть возможность задать соединение через прокси на странице настроек Settings => Proxy Settings.

именно пакет проксей подключить 20-100шт и работать сразу через все

AndrAscii:
- именно по кускам HTML кода?

да, нужно найти все страницы в которых есть заданный фрагмент кода

AndrAscii:
Для стран СНГ - 60$, что примерно 3700 рублей за подписку в год.
Для стран Запада - 100$ за подписку в год.

Screaming Frog SEO Spider £149.00 Per Year

зачем платить за урезанный функционал?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий