- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
есть переменная $html которая содержит код странцы сайта:
как убрать все лишее и оставить только: "Текст который мне нужен" ?
my $text = "приведенный фрагмент HTML";
my $needed_text = ($text =~ /<span id="ct100_ContentPlaceHolderCenter_Context1">(.*?)<\/span>/gis)[0];
Данный скрипт не учитывает того, что нужного span в HTML может не быть. Обработку ошибок делайте сами сообразуясь с задачей. Также, если в вашем искомом тексте будет встречен </span>, то регекс требует модификации. В общем идея понятна, а уж конкретно под задачу доточить всегда можно самому.
А может просто убрать все html-теги и лишние пробелы по краям?!
strip_tags
Упс. провтыкал, что надо на перле а не ПХП :)
Тут внизу страницы есть реализация функции на перле:
http://will.mylanders.com/seti/stats_how.php3
my $text = "приведенный фрагмент HTML";
my $needed_text = ($text =~ /<span id="ct100_ContentPlaceHolderCenter_Context1">(.*?)<\/span>/gis)[0];
Данный скрипт не учитывает того, что нужного span в HTML может не быть. Обработку ошибок делайте сами сообразуясь с задачей. Также, если в вашем искомом тексте будет встречен </span>, то регекс требует модификации. В общем идея понятна, а уж конкретно под задачу доточить всегда можно самому.
Согласен, но лишние переменные - зачем? Лишнее убираем (id тега один на документ)
$html =~ s/id="ct100_ContentPlaceHolderCenter_Context1">(.*?)</$1/s;
Согласен, но лишние переменные - зачем? Лишнее убираем (id тега один на документ)
$html =~ s/id="ct100_ContentPlaceHolderCenter_Context1">(.*?)</$1/s;
Да, только надо проверить конечно будет ли замена быстрее поиска (если идеализировать решение). Плюс убивать исходную строку может быть не очень хорошо, а вдруг пригодится :).
PERL дает нам что? Правильно! TMTOWTDI (There's More Than One Way To Do It)!