Поиск и замена внешних ссылок в файлах сайта

F
На сайте с 01.03.2012
Offline
15
fab
992

Есть сайт на html, более 100к страниц

задача: найти все внешние ссылки (только внешние) на страницах и заменить на текст, например на анкор самой ссылки

Я решил вопрос составлением регулярного выражения для поиска:

<a [^<>]*href="http*://(?!mysiteone|mysitetwo)+([^/"']+)[/'"][^<>]*>([^<>]+)</a>
и заменой на
\2
например через ctr-H в notepad++

mysiteone и mysitetwo - например домены, ссылки на которые менять не нужно

Кто иначе решает подобные вопросы?

ICQ 1088шесть7991
D
На сайте с 01.02.2013
Offline
3
#1

Можно скрипт либо на bash либо на php написать, ничего сложного

Услуги Наращивание ногтей киев (http://nailsmade.com.ua/narashhivanie-nogtej.html) и Покрытие шеллак (http://nailsmade.com.ua/pokryitie-nogtej-shellakom.html) Женский журнал мода и красота (http://wbeauty.com.ua/2013/03/14/kak-byt-modnoj-jetim-letom/)
F
На сайте с 01.03.2012
Offline
15
fab
#2

если есть готовый, можно в студию?

Andreyka
На сайте с 19.02.2005
Offline
822
#3

Используй силу find xargs sed

Не стоит плодить сущности без необходимости
DB
На сайте с 23.10.2010
Offline
36
#4
Andreyka:
Используй силу find xargs sed

даже жаргон инопланетный.

подпись
D
На сайте с 01.02.2013
Offline
3
#5
fab:
Есть сайт на html, более 100к страниц
задача: найти все внешние ссылки (только внешние) на страницах и заменить на текст, например на анкор самой ссылки

Я решил вопрос составлением регулярного выражения для поиска:
<a [^<>]*href="http*://(?!mysiteone|mysitetwo)+([^/"']+)[/'"][^<>]*>([^<>]+)</a>
и заменой на
\2
например через ctr-H в notepad++

mysiteone и mysitetwo - например домены, ссылки на которые менять не нужно

Кто иначе решает подобные вопросы?

У вас unix система или win?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий