- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Парсер не по тегам парсит.
Можно ли самому указывать части кода, между которыми парсить текст?
Можно ли самому указывать части кода, между которыми парсить текст?
Нет )
Дэмку скачайте, попробуйте. Он сам определяет тело статьи, в соответствии с настройками.
Есть фильтры: парсить/не парсить статьи/абзацы если содержит указанное
Нет )
Я тоже не нашел. Мне нужно из списка URL спарсить определенный текст, например, между <h2>... </h2>. Может быть, добавите возможность такой настройки?
Мне нужно из списка URL спарсить определенный текст, например, между <h2>... </h2>.
Он может работать по списку урлов и парсить h заголовки в тексте.
А чтоб указывать конкретные блоки для парсинга это надо content downloader, datacol и т.п.
Neo00007, Вы имеете отношение к разработчикам парсера?
Neo00007, Вы имеете отношение к разработчикам парсера?
нет )
Но разработчик вряд ли будет делать парсинг по тэгам, не один раз спрашивали.
Другая концепция, другой софт.
Где в настрйоках убрать или повысить лимит на ошибку парсинга выдачи? Парсит из-под проксей и периодически часть отваливается. Поэтому после 5 неудачных попыток парсинг прерывается. Вот скрин https://yadi.sk/i/yScQlY_832fvJZ
Эта ошибка уже исправлена. Обновитесь. Связана была с тем, что в выдаче поисковой системы проскакивал ложный идентификатор капчи, ну а капчу софт не мог получить.
Эта ошибка уже исправлена. Обновитесь. Связана была с тем, что в выдаче поисковой системы проскакивал ложный идентификатор капчи, ну а капчу софт не мог получить.
Я пробовал на версии 2.0.7. Сейчас, смотрю, новее версии нет. Выходит, причина в чем-то другом. Писал на почту, можем пообщаться там.
По итогу, все то же самое https://yadi.sk/i/RnnypxYT32vJkx
Если юзаете прокси, то могут быть просто забаненные прокси. Данный вопрос лучше обсудить лично, напишите мне на мыло, поищем причину.
Вышло обновление до версии 2.1.1. В ней сделано следующее:
1. Улучшено качество парсинга контента без разметки. Я ему как-то не уделял внимания особого, так как ни кто не просил, больше ориентировался на статьи. Теперь даже по самым неконтентным кеям собирается очень хороший и чистый контент.
2. Добавлен режим парсинга контента без разметки по одному предложению на строку, для доргенов.
3. Транслит парсера адаптирован под Pandorabox.
4. Исправлена ошибка сбора изображений: устранено влияние фильтра по длине абзаца на количество изображений в тексте.