Программа для поиска исходящих ссылок ( спам )

K1
На сайте с 21.01.2008
Offline
99
1408

Ув. вебмастера. Дошли руки до старого сайта сделанного по Веб 2.0 Но немного криво. В комментариях просочилась куча невидмого спама ( исход. ссылки через точки, смайлы, запятые и пр.) Надо все это почистить.

Подскажите, пожалуйста легкую софтину для поиска только исходящих ссылок по всему сайту. Так, как это к примеру делает бот сапы... Спасибо.

VZ
На сайте с 16.09.2007
Offline
40
#1

Если база в мускуле, то проще и быстрее будет в базе прочекать/удалить. Что-то типа

DELETE FROM table_name WHERE comments_text LIKE "%htttp://%"

xpert13
На сайте с 15.09.2008
Offline
127
#2

Добавляйте в сапу, их бот класно с этой задачей справится :)

K1
На сайте с 21.01.2008
Offline
99
#3
xpert13:
Добавляйте в сапу, их бот класно с этой задачей справится :)

Согласен, удобно, но большой минус в том, там только УВ 3 бьется((( Вот если бы подобный скриптик...

Konstantin12 добавил 23.07.2009 в 20:49

VadoZ:
Если база в мускуле, то проще и быстрее будет в базе прочекать/удалить. Что-то типа
DELETE FROM table_name WHERE comments_text LIKE "%htttp://%"

Проблема в том, что там есть и полезные ссылки...

R
На сайте с 24.01.2008
Offline
180
#4

ну что может кто напишет робота который просканирует сайт, а потом на ссылки ?

Удаление вирусов с сайта, защита сайта, Гарантия! ( /ru/forum/999073 ) -> топик на маулталк ( http://www.maultalk.com/topic113834s0.html ) -> Топик в сапе ( http://forum.sape.ru/showthread.php?t=79363 ). TELEGRAM - https://t.me/Doktorsaitov
[Удален]
#5

Или я что-то не понимаю или одно из двух :)

Ведь есть же масса софта, проверяющего все линки сайта на валидность.

Как правило все эти программы дают отчет о линках (в тч и внешних).

Кроме того, есть онлайн сервисы делающие тоже самое. (Сейчас не вспомню, но встречал)

А если как-то сервис не может проверить ВСЕ страницы - ну скормите ему карту (как вариант по-уровневую)..

Из софта у меня вот завалялись: древний-древний CHECKWEB (ещё 1998г ;) ), REL Link Checker и какой-то linkscan.

Уж не помню точно каким именно из них я проверял линки и получал отчёты.

Пока писал - поискал (всё-таки полезный файл descript.ion и правильная качалка ;) ).

REL Link Checker теперь оказывается Web Link Validator, а linkscan тоже живет.

UPD.

xenulink вот еще вроде то..

VZ
На сайте с 16.09.2007
Offline
40
#6
Konstantin12:

Проблема в том, что там есть и полезные ссылки...

Konstantin12, ИМХО через БД всеравно будет быстрей всего.

Тем более, что сначала можно удалить комментарии содержащие

>.</a>
и тому подобную фигню.

А потом прочекать оставшиеся на предмет полезности ссылок.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий