Бесплатный многопоточный парсер WebArchive в виде плагина для CheckParams

Subudayj
На сайте с 24.06.2008
Offline
67
#71
BotaniQ:
Возможно ли править руками страницы и ссылки?:)

Да. В логе в каждой папке с годом указаны названия сохраняемых файлов - их можно потом как угодно править.

Quo vadis?
BotaniQ
На сайте с 30.07.2007
Offline
74
#72

Еще вопрос, как быть с файлами типа *.zip?

Они не скачиваются, а открываются в браузере

�8��XU�}��97Pj�լz�hD0jc�LcUA�$h�����YWA�2�98K%3�`s��0�6���t�Q�ff�Z��x�ҠҙL�������8Ƈ[E��r%@N�v� �a�{�G����Y�Y�**$�̶����2�f�UI���G���F�n*����d��~����F��h�|L���nq� /J���L�U��~���?0���M��N��d9�Y,��~#�����xu7��l5��/nb�:IT�ϫ �*�.C˸0u���FC�D9� 
База данных почтовых индексов Великобритании (UK Postcode database) (/ru/forum/319540)
Subudayj
На сайте с 24.06.2008
Offline
67
#73
BotaniQ:
Еще вопрос, как быть с файлами типа *.zip?
Они не скачиваются, а открываются в браузере

В index.php в массив с типами файлов:


$mimetypes = array(
'gif' => 'image/gif',
'png' => 'image/png',
'jpg' => 'image/jpg',
'jpeg' => 'image/jpg',
'css' => 'text/css',
'js' => 'text/javascript',
);

добавить строчку с zip:


$mimetypes = array(
'gif' => 'image/gif',
'png' => 'image/png',
'jpg' => 'image/jpg',
'jpeg' => 'image/jpg',
'css' => 'text/css',
'js' => 'text/javascript',
'zip' => 'application/zip',
);
BotaniQ
На сайте с 30.07.2007
Offline
74
#74

Благодарю за ответ.

Еще вопрос:

Можно ли прикрутить как-то сапу?

Из предложений:

Замена всех битых ссылок на главную страницу.

Преобразование внешних в текст.

Subudayj
На сайте с 24.06.2008
Offline
67
#75
BotaniQ:
Благодарю за ответ.
Еще вопрос:
Можно ли прикрутить как-то сапу?

Из предложений:
Замена всех битых ссылок на главную страницу.
Преобразование внешних в текст.

Сапу можно все через тот же index.php прикрутить. Если нужны будут подробности, то напишите в ICQ, попробую помочь.

Идеи хорошие, если руки дойдут, то сделаю :)

BotaniQ
На сайте с 30.07.2007
Offline
74
#76

Еще вопрос.

Как сделать чтобы 404 страницы имели свой вид с ссылкой на главную?

M
На сайте с 09.02.2008
Offline
68
mlu
#77
BotaniQ:
Как сделать чтобы 404 страницы имели свой вид с ссылкой на главную?

Посмотрите скриптик index.php, он ищет файл на диске и выводит его в браузер. Если файл не найден, то выводит 404, вот непосредственно код:


return array('404', 'Not Found');

Сделайте там вывод полноценной страницы со ссылкой на главную и будет работать :)

BotaniQ
На сайте с 30.07.2007
Offline
74
#78
mlu:
Сделайте там вывод полноценной страницы со ссылкой на главную и будет работать :)

Это я нашел:)

А как именно это сделать не догадался, так как я не программист к сожалению)

Буду признателен советом.

M
На сайте с 09.02.2008
Offline
68
mlu
#79
BotaniQ:
А как именно это сделать не догадался, так как я не программист к сожалению)

Думаю, в простейшем случае (костыль) надо будет заменить это:


return array('404', 'Not Found');

На примерно такое:


header("HTTP/1.1 404 Not Found", true, 404);
readfile("404.html");
exit;

Ну и в файлик 404.html нужно будет поместить контент хтмл-странички с 404 ошибкой.

Первая строчка выводит статус и хттп-ошибку (404), вторая строчка выводит содержимое файла 404.хтмл, третья строчка принудительно выходит из скрипта.

Более правильно, думаю, сделает автор скрипта, если он, конечно, не забросил его еще :)

I
На сайте с 20.11.2006
Offline
108
#80

Есть ли кто восстанавливает сайты из вебархива платно именно этим скриптом? ) В личку плиз, если есть. Спасибо.

Скрипт рекомендовали именно этот, потому именно тут спрашиваю именно кто этим скриптом восстанавливает. Ау. )

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий