- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Парсер не по тегам парсит.
Можно ли самому указывать части кода, между которыми парсить текст?
Можно ли самому указывать части кода, между которыми парсить текст?
Нет )
Дэмку скачайте, попробуйте. Он сам определяет тело статьи, в соответствии с настройками.
Есть фильтры: парсить/не парсить статьи/абзацы если содержит указанное
Нет )
Я тоже не нашел. Мне нужно из списка URL спарсить определенный текст, например, между <h2>... </h2>. Может быть, добавите возможность такой настройки?
Мне нужно из списка URL спарсить определенный текст, например, между <h2>... </h2>.
Он может работать по списку урлов и парсить h заголовки в тексте.
А чтоб указывать конкретные блоки для парсинга это надо content downloader, datacol и т.п.
Neo00007, Вы имеете отношение к разработчикам парсера?
Neo00007, Вы имеете отношение к разработчикам парсера?
нет )
Но разработчик вряд ли будет делать парсинг по тэгам, не один раз спрашивали.
Другая концепция, другой софт.
Где в настрйоках убрать или повысить лимит на ошибку парсинга выдачи? Парсит из-под проксей и периодически часть отваливается. Поэтому после 5 неудачных попыток парсинг прерывается. Вот скрин https://yadi.sk/i/yScQlY_832fvJZ
Эта ошибка уже исправлена. Обновитесь. Связана была с тем, что в выдаче поисковой системы проскакивал ложный идентификатор капчи, ну а капчу софт не мог получить.
Эта ошибка уже исправлена. Обновитесь. Связана была с тем, что в выдаче поисковой системы проскакивал ложный идентификатор капчи, ну а капчу софт не мог получить.
Я пробовал на версии 2.0.7. Сейчас, смотрю, новее версии нет. Выходит, причина в чем-то другом. Писал на почту, можем пообщаться там.
По итогу, все то же самое https://yadi.sk/i/RnnypxYT32vJkx
Если юзаете прокси, то могут быть просто забаненные прокси. Данный вопрос лучше обсудить лично, напишите мне на мыло, поищем причину.
Вышло обновление до версии 2.1.1. В ней сделано следующее:
1. Улучшено качество парсинга контента без разметки. Я ему как-то не уделял внимания особого, так как ни кто не просил, больше ориентировался на статьи. Теперь даже по самым неконтентным кеям собирается очень хороший и чистый контент.
2. Добавлен режим парсинга контента без разметки по одному предложению на строку, для доргенов.
3. Транслит парсера адаптирован под Pandorabox.
4. Исправлена ошибка сбора изображений: устранено влияние фильтра по длине абзаца на количество изображений в тексте.