- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Нужна регулярка поиска ссылок, ведущих на определенный домен (например на site.ru). Т.е. из текста
должна выцепиться вторая ссылка (ссылок всего две, первая ведет не на интересующий домен).
При этом у тега "a" допускаются отличные от href атрибуты, которые могут содержать самые разные символы, в том числе "<", ">" (может это и некорректно, но мало кто придерживается стандартов).
По icq знакомый предложил вариант регулярки начинающийся так:
но она обрубит атрибуты, содержащие ">".
Сам пришел к этому:
но она на входе:
распознает все после "aaa " и до " ccc", потому что (.*?) в начале ругулярки "съест" все от href'а первой ссылки до href'а второй.
Если за основу брать эту регулярку, то запретив в (.*?) вхождение "href" или "</a>" задача будет решена. При этом как запретить вхождение одного символа понятно ([^some_symbol]*?), а как запретить слово неясно ([^(?:word)]*? - сиволы слова воспринимаются как набор, а не как слово, потому что находятся внутри квадратных скобок).
P.S.: определенные допущения уже имеются в приведенном коде, возможно необходимы еще?
...но она обрубит атрибуты, содержащие ">".
Дык может тогда использовать не одну регулярку, а выцепить сначала все ссылки, а потом на этот массив наложить фильтр?
Такое решение тоже рассматривается.
Но конкретно здесь интересно докопаться до решения на регулярках или понять, что его нет или оно неприемлимо.