- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Так как в составлении регулярных выражений я полный ноль, прошу помощи знатоков :o
В общем имеется дамп базы сайта, в которую нехорошие люди насовали несколько тысяч ссылок, которые оттуда нужно напрочь удалить.
Ссылки эти выглядят так:
Где spamsite.ru/spam.php всегда разная ссылка, то есть на разные страницы разных сайтов, и с разным расширением, то есть .php, .html, .asp и так далее.
site.ru/images/blank.png всегда одна и та же картинка.
Собственно помогите, пожалуйста, с регуляркой для notepad++, которая всю эту прелесть сможет вычистить, но при этом не уничтожит вообще все ссылки. У этих как бы отличительная черта - эта картинка, у нормальных ссылок её нет.
В Sublime вот такую штуку только что протестировал.
Nopepad++ уже забыл. Регулярка будет, само собой такой же, но на сколько удобно пользоваться, незнаю.
Если хотите, можете постучать в контакты в профиле, очищу Вам дамп, чтобы самому не устанавливать Sublime.
<a href="http://(www\.)?(spamsite\.ru|spamsite2\.ru|spamsite3\.ru)/[^"]+"[^>]*>.*?</a>
домены spamsite все таки придется прописывать, иначе по другому никак.
Всё проще.
1.Удаляйте все:
<img src="http://site.ru/images/blank.png" border="0" style="border: 0">
У вас получиться:
<a href="http://spamsite.ru/spam.php"></a>
2. Регуляркой:
Искать:
<a href=.*?></a>
Заменить на:
<img src="http://site.ru/images/blank.png" border="0" style="border: 0">
1.Удаляйте все:
Ну если при условии что все анкоры одинаковы, тогда
<a href="http://[^"]+"[^>]*><img src="http://[^"]+?blank\.png" border="0" style="border: 0"></a>
домены spamsite все таки придется прописывать, иначе по другому никак.
А чем мой вариант не подходит, при условии, что редактор поддерживает регулярные выражения с "ленивой квантификацией"?
Повторюсь, прежде чем писать, протестировал.
Ну если при условии что все анкоры одинаковы, тогда
Доброе утро :)
Это в ТЗ написано:
Это в ТЗ написано:
А кто его читает.. :)
А чем мой вариант не подходит, при условии, что редактор поддерживает регулярные выражения с "ленивой квантификацией"?
Имхо, даже с ленивой квантификацией (не жадной) то этот вариант все равно отхватит лишнего с первого '<a' до первого встречного '<img src'. Если даже учесть, что переводы строк точкой не будут соответствовать, лучше все же написать более конкретно - <a [^>]+>