Нужна помощь по регулярному выражению

[Удален]
581

Допустим есть sait.ru

Вот его исх.код.

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-type" content="text/html;charset=UTF-8"/><meta  name="Keywords" content=""/><meta  name="Description" content=""/><title >Школа</title><link  rel="stylesheet" type="text/css" href="http://sait.ru/themes/default/markup.css"/><link  rel="stylesheet" type="text/css" href="http://sait.ru/themes/default/main.css"/><link  rel="stylesheet" type="text/css" href="http://sait.ru/js/slimbox/css/slimbox2.css"/><link  rel="stylesheet" type="text/css" href="http://sait.ru/js/datepicker/css/smoothness/jquery-ui-1.7.2.custom.css"/><link  rel="stylesheet" type="text/css" href="http://sait.ru/themes/default/darkblue/theme.css"/><!--[if lt IE 7]><link  rel="stylesheet" type="text/css" href="http://sait.ru/themes/default/ie.css"/><![endif]--><script  type="text/javascript" src="http://sait.ru/js/jquery.js"></script><script  type="text/javascript" src="http://sait.ru/js/slimbox/slimbox2.js"></script><script  type="text/javascript" src="http://sait.ru/js/pngFix.js"></script><script  type="text/javascript" src="http://sait.ru/js/uploadify/swfobject.js"></script><script  type="text/javascript" src="http://sait.ru/js/uploadify/jquery.uploadify.js"></script><script  type="text/javascript" src="http://sait.ru/js/datepicker/jquery-ui-min.js"></script><script  type="text/javascript" src="http://sait.ru/js/datepicker/ui.datepicker-ru.js"></script><script  type="text/javascript" src="http://sait.ru/js/aiwo_survey/jquery.aiwo_survey.js"></script><script  type="text/javascript"> 

<a href="http://sait.ru/category=28">Новости</a>
<a href="/?category=37">Анонсы</a>

Необходимо выпорсить все ссылки которые будут начинаться с http://sait, но которые не будут заканчиваться на .css или .js и т.д. (картиники и т.п.)

Я сделал так:

(http|ftp|https):\/\/sait([\w\-\.,@?^=%&amp;:/~\+#]*[\w\-\@?^=%&amp;/~\+#])*[A-Za-z0-9,@?^=%&amp;:/~\+#][A-Za-z0-9,@?^=%&amp;:/~\+#][A-Za-z0-9,@?^=%&amp;:/~\+#][A-Za-z0-9,@?^=%&amp;:/~\+#](?=\")?

У меня выпаршиваются все ссылки, но ненужные просто обрезаются. А надо чтобы они не выпарсивались.

Объяснил плохо, но как смог.

Хэлпаните кто может........

LenTax добавил 14.02.2011 в 20:23

ап..

10 символов

siv1987
На сайте с 02.04.2009
Offline
427
#1

Свежий индийский код)))

([\w\-\.,@?^=%&amp;:/~\+#]*[\w\-\@?^=%&amp;/~\+#])*

LenTax, а может проще спарсить все ссылки и уже потом циклом отсеять не нужные, если такие чудовища у вас получаются?

тестил на однострочную строку

"#(http://sait.ru[^\"']+)(?<!js|css)[\"']#"

[Удален]
#2

Cпасибо. Учитcя мне ещё и учитcя.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий