Расширение WebDeveloper для Firefox и IE Developer toolbar имеют среди прочих функций проверку валидаторами HTML, CSS, XML-фидов и пр.
Забанить - не забанят, но появится куча бестолковых ссылок с гостевых, да и репутация пострадает. Для Гугла множество ссылок из плохих мест - причина понижения сайта в выдаче. Ходили слухи, что подобный алгоритм работает и в Яндексе, но как обстоят дела сейчас - не знаю и проверять не хочу :)
Давайте перенесём в приват детали.
Имеется в виду техническая сторона дела или интерфейс?
В том случае, что я описал - сами пользователи. Модель с участием пользователей вполне жизнеспособна, пример - википедия, там вполне объективная информация. Если для какого-то исполнителя собрана большая статистика по похожести (для неё пользователи много раз установили "похож на..."), то единичные (или менее некого порогового значения) установки (count = 1) можно отбрасывать, например.
Мне кажется, что удобна будет кнопка "Похоже на ...", при нажатии на которую будет открываться окно, в котором можно будет выбрать исполнителя. Чтобы сразу весь список исполнителей не грузить, сперва выбирается жанр или первая буква исполнителя, а далее всё необходимое подгружается AJAX'ом. Ну и далее пишется в базу данных такого вида:
__________________________
| artist_id | like_artist | count |
------------------------------
| ........... | ............. | ....... |
Где artist_id - данный исполнитель, like_artist - исполнитель, на которого похож данный, count - количество установок исполнителя. Т.е. если на "Группу А" 2 пользователя поставили похожими "Группу Б", count = 2.
В зависимости от count меняется размер шрифта.
Вообще можно не разбивать на огромное множество жанров, а сделать в духе веб 2.0:
"На данную композицию похожи: xxxx". Причём чем более похоже, тем крупнее шрифт.
Т.е. аналог last.fm
На основании чего сортировать - большой вопрос, возможно, на внутренней системе присвоения одного из множества микро-жанров, либо дать возможность пользователям.
Заключить блок внутрь тегов <noindex></noindex>. Учтите, что это конструкция для Яндекса.
Вот самый мощный чтец: http://getid3.sourceforge.net/
Вот класс для других операций с mp3: http://www.sourcerally.net/Scripts/20-PHP-MP3-Class
Они будут вводить кучу полей ввода руками? В результате чтение id3 нужно больше не музыкантам, а слушателям. Если вы думаете, что это технически сложно реализовать, могу выслать исходники на PHP.