- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Всем привет. Может быть я и не правильно мыслю и кто подскажет альтернативу
Вобщем есть страница с которой нужно получить текст ссылок
Код участка с ссылками выглядит так
Я хочу убрать весь код со страницы и оставить только
чтобы затем перебрать ссылки и получить теги
Не получается никак выпилить участок кода =(
а может быть и что то получше есть для реализации?
Это если надо только анкоры. Под добычу ссылок можете перепилить сами.
Спарсить все теги <a>
Спарсить нужный участок кода по окружающим тегам
Юзать DOM + Xpath
получить анкоры не проблема, у меня не получается убрать все лишнее со страницы чтобы в html коде при парсе было только это
Дело в том что ссылок на странице море, а вот привязаться не к чему чтобы выпилить данный блок, собственно это у меня и не получается.
у меня не получается убрать все лишнее со страницы чтобы в html коде при парсе было только это
Не с той стороны смотрите, не надо убирать лишнее, а надо захватывать нужное.
Дело в том что ссылок на странице море
И неужели в этих ссылках нет ничего такого чем можно было их идентифицировать?
а вот привязаться не к чему чтобы выпилить данный блок
А это чем не привязка? </span></a></span></div>
А это чем не привязка? </span></a></span></div>
в том что и дело что привязать не получается, пишу регулярку и вижу белую страницу :)
в том что и дело что привязать не получается, пишу регулярку и вижу белую страницу
Ну значит неправильно ее составляете.
Ну значит неправильно ее составляете.
поэтому и прошу помощи :)
делаю / делал что то вроде
preg_match( '#</span></a></span></div>(.+?)<hr/><ul#s', $str, $out );
да, так все выводит, спасибо.
Опередили, но все равно свой вариант напишу.
$content = preg_replace("/\s/","",$content);
$pattern = "/<\/span><\/a><\/span><\/div>(.+)<hr\/>/";
Также часто вырезание всех пробелов избавляет от многих проблем.
А вообще советую использовать PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/manual.htm или аналоги.