Как убрать кучу битых ссылок на сайте?

NM
На сайте с 18.02.2011
Offline
184
737

Вопрос собственно в следующем.

Имеется сайт на html с множеством битых внутренних ссылок на несуществующие страницы.

С помощью Xenu я вытащил все адреса.

Как теперь массово их убрать из кода?

Нужно что-то типа textreplace (меняем адрес на пробел), но чтобы сразу зарядить всю кучу адресов.

Есть какая-нибудь прога, которую можно было бы для этого использовать?

https://clck.ru/37jxNm пытаюсь здесь отбить просадку в РСЯ Распродажа сайтов https://docs.google.com/spreadsheets/d/1m63GJQUZMrrhTxT2aoAQBX_722Kte2PfvTQEON_SgGE/
Maxim-KL
На сайте с 26.01.2011
Offline
350
#1

NewMoneyMaker, Ссылки в файлах или в SQL базе? Одинаковые ссылки или много разных? Так что бы можно было массово заменить...

Мои услуги по прогонам: ✅Качественный ручной статейный прогон по базе сайтов с ИКС10+ (maximgroups.net/progon-statejnyj) ✅Прогон Максимум - Все включено, 300+ качественных ссылок (maximgroups.net/progon-maksimum)
Mad_Man
На сайте с 10.11.2008
Offline
162
#2
NewMoneyMaker:
Есть какая-нибудь прога, которую можно было бы для этого использовать?

sed в помощь.

NM
На сайте с 18.02.2011
Offline
184
#3

Maxim-KL, SQL базы нет. Все ссылки в файлах. И их где-то 2-3к.

Mad_Man, sed вещь интересная. Но по одной ссылке чистить очень долго. Или там можно массово ссылки загрузить?

Mad_Man
На сайте с 10.11.2008
Offline
162
#4
NewMoneyMaker:
Mad_Man, sed вещь интересная. Но по одной ссылке чистить очень долго. Или там можно массово ссылки загрузить?

1. Сохраняете все чудо-ссылки в файл.

2. Читаете файл построчно.

3. Юзаете sed.

Я насчитал 3-5 строк на баше.

Chaser support
На сайте с 20.10.2014
Offline
12
#5
NewMoneyMaker:

Нужно что-то типа textreplace (меняем адрес на пробел), но чтобы сразу зарядить всю кучу адресов.
Есть какая-нибудь прога, которую можно было бы для этого использовать?

Если у вас все в html-файлах, то кто мешает натравить на директорию простейший скрипт, который пробежит по всем файликам, вытащит из них ссылки, проверит ссылки на доступность (200 ОК). ЕСли ссылка возвращает что-то другое (например 404), то просто делаем замену в этиом файле с помощью регулярного выражения.

Примерно такого:

$pattern = '/(<a href=["|\']?http:\/\/'.$bad_link.'.*>.*<\/a>)/i';

$new_text = preg_replace($pattern, "", file_content);

Chaser (http://chaser.ru) - сервис увеличения телефонной конверсии

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий