- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Привет всем, какой прогой можно отчистить напарсенный контент от излишнего мусора. Желательно софт бесплатный.
vitio про какой мусор идёт речь? Нормальные парсеры выдирают чистый текст, если руки откуда надо.
Или вы про мусор в сканах говорите?
vitio про какой мусор идёт речь? Нормальные парсеры выдирают чистый текст, если руки откуда надо.
Или вы про мусор в сканах говорите?
Граблю с помощью webgrabber или sibir textmaker. После грабинга пергоняю все в txt для использования для доргена. В тексте получается много мусора в виде:
лишние пробелы
$quote и т.д.
vitio, используйте нормальные парсеры.
И с таким вопросом надо было в раздел доров идти.;)
vitio, используйте нормальные парсеры.
к примеру?
Если требуется жесткий перенос из html в txt (на выходе только текст, без единого тега) то прога иероглиф (Hieroglyph) загляни в меню "конверсия"- "html в текст".
Если требуется жесткий перенос из html в txt (на выходе только текст, без единого тега) то прога иероглиф (Hieroglyph) загляни в меню "конверсия"- "html в текст".
Hieroglyph способн отделить текст от остальных блоков страницы?
имеем html:
выбираем "конверсия" - html в текст", получаем txt:
люди имели легкий доступ к свежему воздуху. Однако сегодня большая часть лоджий
и балконов остекляются. Причин для того, чтобы остеклить лоджию или балкон
более чем достаточно: это и стремление расширить полезную площадь квартиры, и желание
улучшить теплосбережение, и пр.
заходим в "инструменты" - "переформатирование" выбираем опцию "удалять жесткие переносы строки" получаем:
имеем html:
выбираем "конверсия" - html в текст", получаем txt:
заходим в "инструменты" - "переформатирование" выбираем опцию "удалять жесткие переносы строки" получаем:
большое спасибо!