Дорген PandoraBox - вопросы и ответы + апдейты. Часть 3

TopperHarley
На сайте с 24.03.2009
Offline
350
#91
ro--ot:
TopperHarley
LAP, парсятся имаги, сниппеты и статьи.
В пресете парсинга сниппетов можно настроить сохранение ссылок в отдельный файл, например links.txt, сохранение сниппетов останется по умолчанию.
Научи пожалуйста LAP проверять наличие файла links.txt, что бы не парсить повторно ссылки на статьи.
Ну и после парсинга статей links.txt надо удалить

Там нет порядка запуска парсеров и отслеживания завершения. Они независимы

Да и все время свободное уходит на ContentBox

Скоро будем парсить статьи с разметкой

PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )
ro--ot
На сайте с 18.12.2009
Offline
164
#92
TopperHarley:
Там нет порядка запуска парсеров и отслеживания завершения. Они независимы
Да и все время свободное уходит на ContentBox
Скоро будем парсить статьи с разметкой

Топ, мне не горит, я готов подождать :)

Просто реально надоело два раза парсить ПС, сначала сниппеты а потом ссылки на статьи.

Можно же все организовать в одном пресете (я проверил), только LAP чуть допилить надо.

zTDS - бесплатная ТДС (https://t.me/z_tds)
twiprogon
На сайте с 22.07.2013
Offline
189
#93

ro--ot, как же ахуенно, когда серверный дорген, знаешь пхп и не надо умолять кого то что то допилить )

Странно, почему юзают десктоп доргены - это же прошлый век

LimonBucks.com (http://limonbucks.com) - Лучшие условия для конверта мобильного трафика
D
На сайте с 19.12.2014
Offline
60
#94
TopperHarley:
Там нет порядка запуска парсеров и отслеживания завершения. Они независимы
Да и все время свободное уходит на ContentBox
Скоро будем парсить статьи с разметкой

Ждем...Топер сделай в Мультилоадере галочку Удалять не только архивы ,но и папки после заливки.А то места на диске не хватает и ошибка потом вылетает :):):)

TopperHarley
На сайте с 24.03.2009
Offline
350
#95

Ап ContentBox 4.1

  • Поддержка парсинга статей с разметкой(beta). Ограничения и подробности на вики: http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой
  • Поправлен переход к следующему парсеру в комбопарсере текста
  • Добавлен параметр &lr= для парсера гугла
  • Удалена функция обхода капчи, так как перестала работать
  • Заменен движок эвристического поиска, работает быстрее на 30%
  • В браузере контента выбранный файл открывается в браузере по двойному щелчку
  • Багофиксы, оптимизация

Важно:

Перед применением парсинга с разметкой нужно прочитать http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой

Скачать: http://sup.toppersoft.ru/threads/contentbox-4-1.293/

D
На сайте с 19.12.2014
Offline
60
#96

TopperHarley почему такие короткие статьи парсит бета версия?

И вставку между этой статьей картинок не возможно?

https://i.imgur.com/k79mv3z.png Вот как с картинками напарсило и подставило домен.

А когда выставляешь символов количество,как оно действует берет только с 1 страницы не добавляя с других?

TopperHarley
На сайте с 24.03.2009
Offline
350
#97
Dofty:
И вставку между этой статьей картинок не возможно?

Насчет дополнения картинками и видео - можно попробовать между тегами, посмотрим как пойдет.

Dofty:
https://i.imgur.com/k79mv3z.png Вот как с картинками напарсило и подставило домен.

Это что? То как надо или то как не надо?

Dofty:
А когда выставляешь символов количество,как оно действует берет только с 1 страницы не добавляя с других?

Статью берет или выкидывает и ищет дальше в зависимости от параметра "мин. объем статьи"

D
На сайте с 19.12.2014
Offline
60
#98
TopperHarley:
Насчет дополнения картинками и видео - можно попробовать между тегами, посмотрим как пойдет.

Это что? То как надо или то как не надо?

Статью берет или выкидывает и ищет дальше в зависимости от параметра "мин. объем статьи"

Это скрин,спаршенного,где вставило не ссылки картинок того портала видимо,а моего домена.

Что то ставишь 10тыс и парсит очень мало.🍿

TopperHarley
На сайте с 24.03.2009
Offline
350
#99

Файл чистки вырезал всё.

Выделил красным на вики про файл чистки http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой

---------- Добавлено 02.12.2017 в 14:35 ----------

Dofty:
Что то ставишь 10тыс и парсит очень мало.

Логично. Если завышать требования то их сложно выполнить. Ты бы еще лимит статей в 10000000 знаков поставил.

D
На сайте с 19.12.2014
Offline
60
#100
TopperHarley:
Файл чистки вырезал всё.
Выделил красным на вики про файл чистки http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой

---------- Добавлено 02.12.2017 в 14:35 ----------


Логично. Если завышать требования то их сложно выполнить. Ты бы еще лимит статей в 10000000 знаков поставил.

Так это статей ,а я думал символов.Но все равно вообще пустые что то выходят страницы.

---------- Добавлено 02.12.2017 в 19:00 ----------

Не чего не понял.

Вот введу 2000-3000 символов.

Не статей же это?И они мелкие парсятся.Пояти пустота.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий