Пофиксил в версии 4.1.1
Скидок не планировал, пока не вижу в них необходимости. А вообще по таким вопросам лучше обращаться лично сразу в телеграмчик @topperharley2013
Демка на сайте есть. В кнопке "Описание" ---------- Добавлено 06.12.2017 в 16:51 ----------
Кстати тут по ссылке видно что идут сначала картинки стабильно. И после статьи идут. Это значит в шаблоне надо поставить так:
{REPEAT-3-3}{PUNIQBINGIMAGE}<img src="[SRC]" alt="[KEYWORD]" title="[KEYWORD]" style="width:200px" />{/PUNIQBINGIMAGE}{/REPEAT}
{CUTPREVIEW-2-3}[BINGFREEARTICLE]{/CUTPREVIEW}
{REPEAT-2-2}{PUNIQBINGIMAGE}<img src="[SRC]" alt="[KEYWORD]" title="[KEYWORD]" style="width:200px" />{/PUNIQBINGIMAGE}{/REPEAT}
Логи по проектам и так пишутся в папку data\logs
А насчет парсить повторно - КБ уже сохраняет в процессе парсинга примерно раз в минуту все что напарсил. После моргания света и загрузки компа парсинг продолжиться далее по еще не спаршенным ключам.
Статьи могу быть короткими в зависимости от тематики. Судя по скрину выше тематика - прон. Какие должны быть статьи по теме "сантехник шпилит озорную брюнетку видео"? Вряд ли будут высокохудожественные портянки текста.
Файл чистки вырезал всё.
Выделил красным на вики про файл чистки http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой---------- Добавлено 02.12.2017 в 14:35 ----------
Логично. Если завышать требования то их сложно выполнить. Ты бы еще лимит статей в 10000000 знаков поставил.
Насчет дополнения картинками и видео - можно попробовать между тегами, посмотрим как пойдет.
Это что? То как надо или то как не надо?
Статью берет или выкидывает и ищет дальше в зависимости от параметра "мин. объем статьи"
Ап ContentBox 4.1
Важно:
Перед применением парсинга с разметкой нужно прочитать http://wiki.toppersoft.ru/ru/contentbox#парсинг-статей-с-разметкой
Скачать: http://sup.toppersoft.ru/threads/contentbox-4-1.293/
Там нет порядка запуска парсеров и отслеживания завершения. Они независимы
Да и все время свободное уходит на ContentBox
Скоро будем парсить статьи с разметкой
видно что прокси не включены совсем.
Надо
1)дать файл проксей,
2)поставить тип проксей, например Auto
3)включить прокси в парсере Google
не помню чтобы такое обещал, но если склероз, то вот делаем так:
Строчку
$bots_list = array("google", "yandex", "rambler", "mail.ru", "msn", "microsoft", "bing", "facebook");
замени на
$bots_list = array("google", "yandex", "rambler", "mail.ru", "msn", "microsoft", "bing", "facebook", "YaBrowser");
в файле cloaking.php в папке доргена
Тут ветка про пандору и про ContentBox
В пандоре за 9 лет уже все что нужно и не нужно для генерации запилили.
А в контентбокс еще есть куда рости. Скоро будет парсер статей с разметкой.
Ну и не стоит забывать что ContentBox без пандоры не работает, так что имеет непосредственное отношение к пандоре.
Вот тут был ап Пандоры 3 недели назад: /ru/forum/comment/15302849
Ну и тут такой еще момент что большая часть вопросов по пандоре уехала на форум поддержки пандоры.
В парсере включить галочку "реКапча" можно
Либо больше проксей, пусть крутит прокси пока без рекапчи не найдет