boodda

Рейтинг
28
Регистрация
21.12.2009

А что за *** постоянно в коде , у меня пхп прям таки изругался матом?

А по вопросу, так перед $A1 в классе надо использовать $this->

То есть типа

for ($i = 0; $i < count($this->$A1); $i++) {

С файлом точно все в порядке, странно что выдает "on line 1", а у вас нет случаем никаких auto_prepend файлов ?

еще можно попробовать обрамить параметр для инклюда в скобки, типа вместо

include '../ini.php';

сделать

include('../ini.php');

но это по моему что то из области неверноятного..

Для начала посмотрите вывод команды top, зайдя по ssh на сервер.

Копирните его сюда может что то откроется.

Обратите внимание на параметр wa, может ваш сервер пытаются пользовать не как http сервер, а например стучат в почту, или брутят пасы. Буквально неделю назад сервер спамеры примеряли, сервер мощный, а почти умирал, решилось отключением почтовых служб.

Это я к тому что все может быть не так очевидно на первый взгляд.

Под значимым текстом подразумевается основной текст, да вырезаются просто даты, ники, метки, отдельные предложения(если они не в тексте), копирайты, и вся мишура со страницы, ну на примере статьи на каком-нибудь блоге, парсер выдаст только текст самой статьи. + Есть наработки по разпознаванию не читаемых(сгенерированых текстов) типа списков ключевиков или кучи линков в тексте.

просто удалить скрипт /scripts/setup.php или поставьте права 0000 на него.

да такие показатели к примеру, но вы как то уж совсем обреченно. существует масса софта который делает одно и тоже, и не чего тем не менее он есть , и стоит, кстати сказать, как чугунный мост.

Я не претендую на роль гения кодера, но парсинг уже неплохо реализован и есть общее понимание куда двигаться далее для получения чистого текста, это раз.

Второе - сервис думаю будет полезен не только дорвейщикам, но и тем же рерайтерам.

Третье - возможными плюсами сервиса может быть не только получение самого текста, но и статистические данные о самом тексте, как в пределах одной конкретной страницы, либо сайта, либо группы сайтов в том числе топа поисковых систем.

удобство веб сервиса может быть например в том что системы управления, а так же серверные доргены, могут получать тексты практически в реальном времени с помощью апи сервиса

Да, то есть вбивается ключ , берется например топ 10 трех ПС и грабятся 30 страниц, из них вырезается значимый текст, нормализуется и вам отдается уже чистый текст.

Конечно существуют моменты когда в конечный текст все таки попадают некоторые вещи не по теме(даты постов, никнеймы) редко, но бывает. Такого мусора менее 5% от общего текста(в большинстве случаев мусор отсутствует), и я ещё продолжаю работу над повышением степени очистки текста , так сказать.

badboy спасибо)

Всего: 131