Капча настолько элементарная что адекватные людям обучить НС под нее не составит труда.
Как выяснилось это внутренние проблемы вебархива, до 10 числа некоторые сайты будут не доступны(вообще это проблема началась раньше 7 числа):
пруф.
Здравствуйте, если какие-то сайты не выкачиваются - скиньте мне их на email я выпушу фикс если он нужен.
По поводу данного сайта - он выкачался у меня без проблем, но на всякий случай скачайте обновления.
Потому что таковы особенности разбора относительных ссылок на локальной машине, залейте файлы на хостинг(или на денвер, XAMPP) и все ссылки будут рабочими. К тому же если ссылки имеют динамических храктер то без преобразования с помощью .htaccess и mod_rewrite они тем более не будут рабочими.
1)whois history.
2)Первая дата в webarchive.
Хотите верьте хотите нет - но допиливать придется не мало, там большое количества всяких тонкостей, к тому же когда автор дойдет до некоторых из них придется довольно часто править ответы вебархива, ладно не буду автору портить интерес сполерами:), и насчет не будет равных вы слегка погорячились.
Индексируется, но не там где надо http://web.archive.org/robots.txt.
Откуда хоть парсяться кейворды то?
Если вопрос адресован мне - то да, есть очень даже рабочая версия.
То есть выкачивал весь web.archive.org :).
Здесь
10 символ.
Подтверждаю, это круто.
С таким доргеном можно как Фредди: