Спасибо, действительно хорошее решение :)
Всё настроил, схема работает как часы.
Если ничего не произойдет - по моим расчетам база будет полностью прочекана за двое-трое суток.
Успейте купить по низкой цене 29$, чтобы бесплатно получить обновления!
Городецкому скидка за идею 50% :)
Еще D-Link 2640U можно перезагружать по телнету
telnet 192.168.1.1
Login: admin
Password: admin
reboot
На РНР это очень просто делается через сокеты.
Проблема вся в том, что Укртелеком не всегда гарантировано поднимает соединение - и перезагружать модем приходится по нескольку раз.
Насчет моста - тоже мысль, т.к. при перезагрузке роутера инет поднимается 2 минуты (если перезагружать несколько раз, то 2 х несколько), а с бриджем может подниматься за несколько секунд.
Осталось решить, что проще сделать под убунтой - и в бой :)
У меня тоже с публичными прокси парсит с трудом 7-10к в сутки
Но всё же лучше, чем совсем без них :)
Спалю фишку - у меня провайдер Укртелеком, у которого при каждой перезагрузке модема даётся новый IP. Как только каптча - программно перезагружаю модем, получаю новый IP и парсю без задержек. На одном IP без задержек получается 500-1000 ключевиков отпарсить. Всего 340-400 перезагрузок и дело в шляпе :)
Осталось только разобраться, как же его, собаку, правильно программно перезагружать... Завтра надеюсь запустить в работу новую схему :)
Да, с 15 секундами не банит
А теперь простой расчет
4 ссылки в минуту * 60 минут * 24 часа * 7 дней = 40320
Никак 170к не выходит
И на дорвеях необязательно размещать картинки порнографического содержания - достаточно просто симпатичных девушек...
Прошелся по регистраторам, у которых есть мои домены.
У 2domains.ru и у idomen.ru нет никаких полей для загрузки сканов.
Только наунет добавил вкладку "Загрузить копии документов" и описал что и как загружать.
А вы говорите, все готовы...
Уверен, что проверять достоверность начнут тогда, когда по одному скану будет 10000 доменов зарегистрировано в сумме у разных регистраторов (сканы ведь не в одни руки продаются). Или когда на доменах будет размещено что-то, что явно и стопроцентно запрещено законодательством в несоизмеримых со здравым смыслом количествах.
Короче, домены для сапы (не на ворованном контенте) и СДЛ - на свой скан.
Домены для дорвеев и для сапы на ворованном контенте - на чужой.
И все в шоколаде.
В общем, погуглил.
Дорвейщики не пропадут :)
На данный момент в базе проверено 60к запросов.
Сегодня придумал фишку, благодаря которой скорость обработки сильно увеличится ;)
В ближайшее время фишку реализую, и числу к 10-му октября выкачу полное обновление базы.
Успейте приобрести за 29$, ведь после чека база подорожает до 49$!
Собственно, вопрос не о private person - понятно, что останется.
Вопрос о галочке "НЕРЕЗИДЕНТ", поставив которую не нужно будет загружать сканы паспорта тем, кто не проживает в РФ.