А в какой будет? Беки подклеиваемого домена - это ссылки на страницы ранее существовавшего на нем сайта. Новый сайт может быть другой структуры и т.д. и т.п. Вижу как вариант - редирект с таких беков на существующие страницы похожей тематики (согласно контенту доноров или логическому смыслу ЧПУ-ссылки).
P.S. И еще n-ый раз: ссылки на 404 не передают вес?
ПХП на коленке:
<?php $baza =<<<END http://site1.ru/blablabla/ololo/page.html http://www.site2.com/ololo/blablabla/page2.html http://site3.org http://site4.org.ua?id=15 http://site5.info#comment2 END; preg_match_all('/http:\/\/[0-9a-zа-я\.\-]+\/?/i', $baza, $result); print_r($result[0]); ?>
Кто-то еще наблюдает скачки кол-ва проиндексированных "протвитеренных" страниц? То есть, влетает быстро, потом кол-во страниц начинает скакать +/- и нормализуется только после АПа.
Пробуйте делать форму и обработчик в одном файле, проверять, были ли переданы данные. Если переданы, выводить результат. Иначе - форму.
А, понял. Да, возможно именно для такой задачи и уместен document.write для создания первичного контейнера. Это как раз тот случай, когда нужно js'ом вывести контент в месте его подключения на странице. Ну а дальше уже в этот контейнер пихать через DOM все что нужно.
Для чего знать именно страницу? Там промежуточные редиректы. Если интересует текст запроса, то его можно получить через имеющейся реферер.
Не сталкивался с таким, считаю, что на странице должен присутствовать хотя-бы body (хотя, скажите это Яндексу :-D )
Первый вариант вообще считаю моветоном, не имеющем в данное время практической ценности
а ссылки типа <a href="http://domain.com/blabla.html">click here</a> не встречаются? то есть, только на морды? в таком случае,
$str = str_replace('">click here</a>', '/index.html>click here</a>', $str);
:)