Найти ссылки, который выдают 404 ошибку

12
Y
На сайте с 23.04.2011
Offline
40
2135

Приветствую. У меня вопрос - есть список, который содержит страницы ,отдающие 404 ошибку. Задача - найти страницу, которая ссылается этой ссылкой. То есть найти страницу ,которая дает такую ссылку, найти и удалить) Есть какие-то сервисы, готовые решения?

anndielm
На сайте с 02.05.2012
Offline
126
#1

yuber, по яндексу вводить запрос ссылки и получите страницы на которых она расположена

DV
На сайте с 01.05.2010
Offline
644
#2

wget --spider -r -l 1 --header='User-Agent: Mozilla/5.0' \

-o wget.log http://мой_сайт

Получится файл с ошибками. Отфильтруйте (тем же grep) 404, вот вам и список.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
S2
На сайте с 07.01.2008
Offline
611
#3

А вы уверены что какие-то страницы на них ссылаются? Раз 404 отдаётся, значит страницы не существует по идее.

А вообще можно попробовать PageWeight для этих целей. Если сайт небольшой декстопную версию, если большой онлайн.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
6uoncuxo3
На сайте с 05.11.2008
Offline
202
#4

http://home.snafu.de/tilman/xenulink.html

В выгруженном отчёте можно просмотреть страницы, ссылающиеся на 404.

We all live in a sick world, where hatred is a weapon, and freedom - a dream. © На небе — Бог, на земле — Россия. © Сербская поговорка.
anndielm
На сайте с 02.05.2012
Offline
126
#5
Str256:
А вы уверены что какие-то страницы на них ссылаются? Раз 404 отдаётся, значит страницы не существует по идее.

Если бы такой страницы не существовало никогда, то 404 и небыло бы. Когда-то на нее ссылались, страница убилась а ссылка осталась, вот и хотят ссылки почистить

Y
На сайте с 23.04.2011
Offline
40
#6
Str256:
А вы уверены что какие-то страницы на них ссылаются? Раз 404 отдаётся, значит страницы не существует по идее.

А вообще можно попробовать PageWeight для этих целей. Если сайт небольшой декстопную версию, если большой онлайн.

ну если страниц нет, то они не будут выходить в отчете, их просто нет. Раз они отдают 404 или 301 то значит они где-то имеются.

---------- Добавлено 30.07.2012 в 12:45 ----------

anndielm:
Если бы такой страницы не существовало никогда, то 404 и небыло бы. Когда-то на нее ссылались, страница убилась а ссылка осталась, вот и хотят ссылки почистить

да ,логика именно такая - хочу убрать все 404 и 301 ответы

savage
На сайте с 10.01.2007
Offline
224
#7

В semonitor есть модуль анализатор сайта: http://www.semonitor.ru/site_analyzer.html

Купить / продать сайт ( https://www.telderi.ru/?pid=ca1f70 ) | Недорогой и надежный хостинг ( https://www.get-host.ru )
S2
На сайте с 07.01.2008
Offline
611
#8

Я написал, потому что не знаю где ТС получил этот список. К примеру в ВМ - бывало, что 404 показывается даже если и все внутренние ссылки ведущие на эту страницу уже удалены давно. Помню для одного сайта вообще отключил там отображение этой ошибки после того как безрезультатно прождал несколько месяцев удаления. Мне в их саппорте тогда ответили, что 404 потому что, на эту страницу есть внешняя ссылка.

А если получил этот список сканирующей программой, то и кто ссылается тоже сразу видно, если таковые страницы есть.

Y
На сайте с 23.04.2011
Offline
40
#9
Str256:
Мне в их саппорте тогда ответили, что 404 потому что, на эту страницу есть внешняя ссылка.

так вот мой вопрос как раз в том - как найти эту внешнюю или внутреннюю ссылку?

S2
На сайте с 07.01.2008
Offline
611
#10
yuber:
так вот мой вопрос как раз в том - как найти эту внешнюю или внутреннюю ссылку?

Если внешняя ищите в архиве выгрузки ВМ.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий