Проверка PageRank

12
M
На сайте с 09.02.2008
Offline
68
mlu
#11
latteo:
Какие параметры ПК при этом? 4 пенёк, помнится мне, вешался до необходимости хардресета, при 3000-5000 одновременных потоков, не зависимо от используемого софта.

Windows Server 2008 R2 Std, Intel Core 2 Duo E7400 @ 2.8Ghz, 4 гигабайта оперативки, гигабитный интернет, четыре потока, 5000 соединений.

Видео: http://youtu.be/U6nLR6JVviY

UPD: 3000-5000 одновременных потоков довольно проблематично запустить в рамках одного софта, если не сказать, что вообще невозможно. Уже после 1500 потоков у 90% программ начнутся проблемы из-за резервирования порядка одного мегабайта стека на каждый поток.

V
На сайте с 21.10.2007
Offline
90
#12

Актуальный антибан таймаут 800-900мс

Бумеранг777
На сайте с 08.02.2009
Offline
660
#13

немного не в тему но может кто знает когда в последний раз был апдейт PR?

Бурж хостинг ( https://vk.cc/8kDAui ) - Разрешён адалт. Секс по телефону ( https://vk.cc/6u7YCX ) - Мужской трафик конвертит на ура. Адалт дейтинг ( https://vk.cc/bZlb2J ) - Смарлинк с высоким EPM
M8
На сайте с 17.10.2012
Offline
18
#14
Бумеранг777:
немного не в тему но может кто знает когда в последний раз был апдейт PR?

http://seobudget.ru/updates/

alfamale
На сайте с 07.08.2008
Offline
41
#15
mlu:
Если проверять большими объёмами, равномерно распределяя запросы с одной айпи между несколькими десятками айпи гугла, то банится одновременно на всех айпи примерно через одну минуту. За это время (за одну минуту) можно проверить любое доступное количество доменов, например, 3-5 миллионов, всё ограничивается лишь траффиком. Проверено неоднократно с помощью cp2litepr.

То есть, дело не в количестве соединений, количестве проверяемых адресов, а во временных границах, я верно понимаю?

А если допустить, что можно точно определить, когда начинается бан, предугадать его и сделать некоторый таймаут?

Дело в том, что в моём случае идёт работа с БД и записью статуса, поэтому, хоть распарралеливание и даёт какой-то толк, но разницы нет, в 8 потоков я проверяю или в 200 - результат по времени один и тот же, ибо в моей реализации основной поток ждёт готовности всех потоков и уже после, сам основной поток пишет данные в БД. База весит порядка 5 Гигов и выборка формируется из довольно сложного запроса. Теоретически, можно каждый раз делать полную выборку из всей БД, но относительно эффективно пока было работать с записью последнего проверенного и записанного айдишника. При полной выборке по все БД, сама выборка длится порядка 15 минут. Машинка у меня слабенькая - нетбук Asus EEE PC 1000H: Intel Atom N720 1,60 GHz / 1 Gb RAM / вендора и скорость харда не знаю.

latteo:
Утыкался раньше в лимит около 5000 проверок, далее вместо результата выдавалось сообщение о бане.

А есть пример сообщения о бане и примерное время ожидания до разбана?

mlu:
Windows Server 2008 R2 Std, Intel Core 2 Duo E7400 @ 2.8Ghz, 4 гигабайта оперативки, гигабитный интернет, четыре потока, 5000 соединений.

Видео: http://youtu.be/U6nLR6JVviY

UPD: 3000-5000 одновременных потоков довольно проблематично запустить в рамках одного софта, если не сказать, что вообще невозможно. Уже после 1500 потоков у 90% программ начнутся проблемы из-за резервирования порядка одного мегабайта стека на каждый поток.

Мощно! Видео не резаное, я так понимаю? В таком случае, могу только с уважением позавидовать.

valerius:
Актуальный антибан таймаут 800-900мс

Спасибо! А можно все факторы бана и разбана привести, пожалуйста. Бан наступает только по прошествии определённого времени или зависит от количественных показателей?

Антибан таймаут имеется в виду между проверкой каждого урла или когда схлопотал бан, достаточно паузы на секунду?

ничего лишнего
M
На сайте с 09.02.2008
Offline
68
mlu
#16
alfamale:
То есть, дело не в количестве соединений, количестве проверяемых адресов, а во временных границах, я верно понимаю?
А если допустить, что можно точно определить, когда начинается бан, предугадать его и сделать некоторый таймаут?

По моему опыту одна конкретная айпи гугла (уверен, что за ней стоит много серверов) смотрит количество запросов клиента за одну минуту, раньше минуты 100% не забанят. Если забанили, то информация о бане в течение нескольких секунд распозается по остальным айпи гугла и дальше уже везде выдаёт 403 ошибку. Если мои мысли относительно схемы работы правильные, то единственный способ много проверить - сделать очень много соединений до разных айпи гугла, а потом в течение некоторого времени выполнить максимально возможное количество запросов. Если проверять надо мало, но без бана, то использовать задержки.

alfamale:
Дело в том, что в моём случае идёт работа с БД и записью статуса, поэтому, хоть распарралеливание и даёт какой-то толк. Машинка у меня слабенькая - нетбук Asus EEE PC 1000H

Ну, как я уже говорил, если речь про скорость, то тут только один вариант - сперва подготовить все данные, вплоть до составления готовых хттп-запросов, а потом всё разом быстро проверить. Если надо, чтобы не забанили, то просто большие задержки.

У меня тоже такой ноут, винт там основной тормоз. Потом идёт проц :)

alfamale:
А есть пример сообщения о бане и примерное время ожидания до разбана?

403 ошибка http, насколько я помню. Время - от нескольких часов (при условии очень массовой проверки) до перманентного бана айпи при сиськамасиськом нарушении безобразий.

alfamale:
Мощно! Видео не резаное, я так понимаю? В таком случае, могу только с уважением позавидовать.

Нет, видео не редактировалось, но оно уже основательно устарело, после этого было много новых рекордов в том числе и по смежным темам.

V
На сайте с 21.10.2007
Offline
90
#17

800-900 мс интервал между запосами с одного IP

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий