TopperHarley

TopperHarley
Рейтинг
350
Регистрация
24.03.2009

Ап ContentBox 3.4.4

Улучшен учет ключей по которым нет контента

Продолжение

LinkerClub:
Можно как-то настроить кастомный robots.txt, галочка "заливать все файлы в папке шаблоне" не заливает мой файл robots.txt

Можно. Вот как: http://wiki.toppersoft.ru/ru/robots.txt

Кстати у нас давно есть телеграм чат: https://t.me/pandorabox

Скайп чат переносится туда, в телегу

Ап ContentBox 3.4.3

Добавлена фича обхода капчи для парсера Google

Ап PandoraBox 2.28

  • Макрос {BUILDARTICLE}...{/BUILDARTICLE} теперь вставляет ключи и ссылки в текст, либо можно это отключить стандартными модификаторами /nk,/nl
  • Вставка ключей в макросе {INSERTKEYS} через запятую {INSERTKEYS-(key1, key2)}
  • Макрос [COMMENTSCOUNT] теперь работает и внутри блоков {CATITEMS}/{MAINITEMS}
  • Макрос {CASE} теперь умеет принимать на вход "единственное/множественное число", то есть "яблоко/яблоки". Пример: {CASE-5-*}, звездочка - это множественное число
  • Макрос {CUTPREVIEW} можно объявлять с номером вырезки для системы аноносов, например {CUTPREVIEW-2-20-30}[GOOGLEARTICLE]{/CUTPREVIEW}, потом выводить так: [PREVIEW-2]
  • Обновлен плагин ISPAddDomain 3.3 - фикс проблем авторизации
  • Обновлен плагин KeywordsTool 0.4 - добавилась фича чистки ключей от мусора(не буквы, не числа, не основные знаки - удаляем)
  • Обновлен плагин TextParser v1.3.4 - добавлена поддержка ручного ввода рекапчи
  • Другие багофиксы, оптимизация

Было в PandoraBox 2.27.2

  • Обновлены библиотеки SQLite до последней версии
  • Парсинг контента в базу данных для ContentBox. Для работы нужно обновить ContentBox http://pandoraboxx.ru/update/ContentBox.zip и юзермакросы.

Еще было:

kxk:
Это ппц дор на контент боксе из тысячи страниц весит ~500 мегабайт при том что качество такого дора выходит на качественно низкий уровень к сожалению, форматирования у аброкадабры полученной по дефолту нету.
Ну это пол беды для парсинга 30к кеев и получения аброкадабры у вас уйдёт пара часов если не более и очень крутые прокси.

Увы, пока продукт не годен, место на ssd не безлимитно и каша какую выдаёт коробка не вылезет в SE.

Место на диске расчитывается просто. Размер страницы * число страниц. Если шаблон большой, на 50кб, то 10 000 стараниц - это 500 мб. Соответственно нужно уменьшать размер шаблона. Это можно сделать прежде всего сразу выбирая kturbq шаблон. Ну и уменьшить можно через PHPINC макросы.

А насчет скорости, очень крутые прокси не нужны, чаще всего пользователи юзают те, что напаршивает бесплатно встроенный проксиЧекер(который сам умеет находить прокси листы). Скорость парсинга примерно 10..20к в час, так что да, 30к спарсить - это часа два.

Из форматирования есть разбивка на параграфы и оформление статьи через макрос BUILDARTICLE.

Насчет того что не вылезет в SE, вылазит как за здрасте. Вот свежий фин.стрип коллеги по цеху, который юзает PB+ContentBox, накосил 220к рубликов

---------- Добавлено 21.08.2017 в 12:15 ----------

Dofty:
TopperHarley
Почему рубрики глючат в wp через плагин который устанавливается?
Может это из-за bd не через mysql ?

Тормозят или прям реально глючат? Да, вполне может быть изза sqlite

kxk:
Парни как заставить парсить контент бокс быстрее 10-50 ключей в минуту ибо это ну очень медленно.

Нормальная скорость - 250 ключей в минуту, это примерно 15к ключей в час, хотя коллеги в скайпе писали что и 20к+ ключей в час разгоняли

Если же парсить например только снипеты, то там вообще космическая скорость, так как ходить по сайтам не нужно

WEB-мастер:
В каментаксах куча варингов(

Надо обновить скрипт delayedlinks.php из архива на сервере

WEB-мастер:
Топер сделай что бы можно было вставлять в доры тексты из разных каталогов и подкаталогов на JP при этом файлы не имеют .txt

Пандоре все равно есь расширение или нету, txt или какое-то любое другое

В макросе RANDLINE(и аналогах) можно указывать произвольный путь с любыми расширениями и БЕЗ расширения

Опиши что конкретно у тебя не получается.

---------- Добавлено 13.08.2017 в 11:09 ----------

Dofty:
Да это.
А нельзя через jquery сделать подгрузку картинок на странице,а то серваки падают?
Этих макросов
{PUNIQGOOGLEIMAGE} <p><a href="[KEYWORDURL]" target="_blank"target="_blank" ><img src="[SRC]" width="500" alt="[BKEYWORD]" title ="[BKEYWORD]"></a></p>{/PUNIQGOOGLEIMAGE}

Макрос PUNIQGOOGLEIMAGE парсит урлы картинок с чужих серваков и выдает в поле "[SRC]"

То есть выдача будет такая: ...<img ... src="http://левый_сервер/картинка.png" ... > ...

Далее все отдается в браузер и уже браузер скачивает картинку, так что нагрузка по выкачиванию картинки лежит на клиенте, а не на сервере.

Сервер не может ложиться изза внешних картинок

Не=но в предыдущем сообщении.

С телефона не попадаю по буквам

Так что не требуется там архивация

Остальные пункты посмотрю позже. Любой каприз за ваши деньги

Чтобы макрос не генерировал контент в базу данных нужно его выключить через меню макросов

---------- Добавлено 08.08.2017 в 17:34 ----------

Архивацию нужно отключить в пандоре, но заливщик может сделать архивацию на этапе заливки

IBakalov:
TopperHarley, выше спрашивал, но видимо пролистали, продублирую:

Сделаю после отпуска, я на море щас

Иероглифы не поддерживаются в пандоре. Японский, китайский никак.

Всего: 2916