- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева

Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Алгоритм работы парсера в секрете?
>Алгоритм работы парсера в секрете?
Да, после покупки могу все объяснить если есть желание.
Это чтото типа этого
Вы очищаете html от ненужных блоков и забираете то что останется или распознаете блок с текстом?
kep, у меня эта программа ничего кроме ошибок не выводит. Я не очищаю html, совсем другой принцип.
Я сейчас что то подобное пишу, тупо ищу самый большой div и забираю текст. пока вроде работает.
Продаете библиотеку с исходниками?
Что-то я в демке жму кнопку, а ничего не происходит.
kep, да для личного использования.
alexf2000, проблемы с сетью у FirstVDS (крайне не советую) работает медленно попробуйте ещё раз http://4iz.ru/contentparser/?url=http://jeck.ru .
ewg777, у меня парсинг идет максимум 0.2 секунды, сравнивать скорость на еле работающем VDS смысла нет на самом деле. Задержка по загрузке страниц решается распараллеливанием запросов.
>Так же есть смысл подумать о выделении релевантных текстов на странице или парсинг нескольких статьей, а не самой большой.
Во время работы находится не один фрагмент а несколько просто пока нет алгоритма их корректного объединения. Кстати применение может быть очень неплохое - берется выдача поисковика по определенному запросу из всех результатов выделяется статья с помощью моего парсера, объединяется по 2-3 штуки и получается неплохой дорвей. Я давно ими не занимался но думаю такой подход не лишен смысла.
Да, несколько месяцев назад писал такое ради эксперимента. В большинстве случаев текст и заголовки выделяло правильно. Складывало в текстовые файлы. Только эксперимент провалился, а в самостоятельной ценности такого скрипта я уверен не был. А Вы на php пишете?
autosubmit, да я пишу на php по большей части.