Тоже давно заметил. Взять хотя бы этот форум, см. чуть ниже - Предыдущая тема / Следующая тема - с nofollow. И так на многих раскрученных сайтах, какие-то группы внутренних ссылок закрываются nofollow, в чём фишка? =)
Нужно написать программу, которая из HTML файла будет вытаскивать текст, название, title, и пр.
затем эта же программа должна класть полученные данные в базу данных в том виде в котором это поймёт выбранная вами CMS
В принципе ничего сложного в написании программы, сложнее разобраться как устроена база данных CMSки.
Есть готовые решения - поищите по слову "граббер сайта"
попробуйте конструктор сайтов http://www.panweb.com , если понравится, напишите в техподдержку, вам помогут сделать форму для регистрации новых сайтов на вашем домене