seomoneys

Рейтинг
81
Регистрация
13.12.2009
Dos3:
будет адекватный человек вбивать 1000 капч за менее 1$ ?

Капча настолько элементарная что адекватные людям обучить НС под нее не составит труда.

00:00:10 Очередь для загрузки пуста, получаем начальную страницу - http://wayback.archive.org/web/20101...//b12-club.ru/.
00:00:14 Нет активных потоков, процесс парсинга завершен.
00:00:25 Очередь для загрузки пуста, получаем начальную страницу - http://wayback.archive.org/web/20101...//b12-club.ru/.
00:00:26 Нет активных потоков, процесс парсинга завершен.

почему так? находит 112 страниц а скачивать не хочет

Как выяснилось это внутренние проблемы вебархива, до 10 числа некоторые сайты будут не доступны(вообще это проблема началась раньше 7 числа):


Wayback Machine Scheduled Outage Friday through Sunday
Posted on October 5, 2011 by internetarchive

The Wayback Machine will be offline from Friday evening, October 7, through Sunday, October 9, 2011. We expect the Wayback to be back in service by Monday morning (PST), October 10, 2011.

So, what’s up? Maintenance is being done on the data center and cooling system where a large percent of the Wayback’s content is stored, and we’ll need to shut off the power there for the duration of the work.

We aren’t making any changes to the Wayback Machine. When we power back up some time on Sunday, things should just start working again. If you are seeing any issues with the Wayback on Monday morning (PST), please drop us a note at info at archive dot org.

пруф.

ufaclub:
00:00:10 Очередь для загрузки пуста, получаем начальную страницу - http://wayback.archive.org/web/20101101/http://b12-club.ru/.
00:00:14 Нет активных потоков, процесс парсинга завершен.
00:00:25 Очередь для загрузки пуста, получаем начальную страницу - http://wayback.archive.org/web/20101101/http://b12-club.ru/.
00:00:26 Нет активных потоков, процесс парсинга завершен.


почему так? находит 112 страниц а скачивать не хочет 😒

почему парсит сайты тока каждый 10? хотя в архиве все есть?

Здравствуйте, если какие-то сайты не выкачиваются - скиньте мне их на email я выпушу фикс если он нужен.

По поводу данного сайта - он выкачался у меня без проблем, но на всякий случай скачайте обновления.

ufaclub:

и если ссылки относительные - то почему когда открываю страницу - по ссылка не пройдеш?

Потому что таковы особенности разбора относительных ссылок на локальной машине, залейте файлы на хостинг(или на денвер, XAMPP) и все ссылки будут рабочими. К тому же если ссылки имеют динамических храктер то без преобразования с помощью .htaccess и mod_rewrite они тем более не будут рабочими.

kolchakA:
Добрый день! Меня интересует алгоритм автоматической проверки возраста домена в независимости от зоны и регистратора. Кто нибудь может подсказать?

1)whois history.

2)Первая дата в webarchive.

Mike05:
Думаю, после доведения напильником ему не будет равных.

Хотите верьте хотите нет - но допиливать придется не мало, там большое количества всяких тонкостей, к тому же когда автор дойдет до некоторых из них придется довольно часто править ответы вебархива, ладно не буду автору портить интерес сполерами:), и насчет не будет равных вы слегка погорячились.

Mike05:
А сам вебахрив разве не индексируется ПС?

Индексируется, но не там где надо http://web.archive.org/robots.txt.

Откуда хоть парсяться кейворды то?

Kost Troll:
Ну так чего есть рабочая версия или можно похерить всю эту тему ???

Если вопрос адресован мне - то да, есть очень даже рабочая версия.

гы, мне за 50$ вроде такое писали, он грабал без остановки (более 100000 сайтов)

То есть выкачивал весь web.archive.org :).

olekit:
а подскажите где ее взять?

Здесь

10 символ.

TopperHarley:
Крута

Подтверждаю, это круто.

С таким доргеном можно как Фредди:

Всего: 120