Про whois не скажу, а вот пейджранк легко за 1млн+ в час можно прочекать при условии большого количества относительно хороших проксей.
Могу помочь с написанием чего-то подобного на основе CheckParams
Это статистика проверки PR, скорость еще не такая высокая из-за отсутствия свободных проксей :)
Threads: 1000/1000, speed: 309.98 urls/sec., work time: 336 sec., urls processed: 98511, urls failed: 15, urls remains: 0
Google-PR: Checks: 111351, successful: 98496, failed: 6567, bans: 601, free proxies: 0, blocked proxies: 411, using now: 1000
PLU engine: threads: 100/100, sources: 3, source proxies: 0, good: 1411, deleted: 0, checking: 0
Script engine: queued tasks: 0
Traffic incoming: 301169 Bps, outgoing: 204635 Bps; CPU usage total: 11.41%, program: 1.09%
Memory: working set: 143020032, pagefile usage: 162484224, Handles: 6437
com, .net, .org с нормальныйми показателями уходят Snap, NJ и так далее
+ куча народу сидит со своими скриптами, и "долбит" реселлерский API у разных зарубежных регистраторов.
У особо продвинутых есть некие отношения напрямую с регистраторами, что дает им преимущество.
Можно на CheckParams что-то подобное написать:
/ru/forum/511667
Коллеги, если кому интересно, выкладываю код модуля для проверки наличия сайта в "веб-архиве" (как вы, наверное, заметили, в последнее время сайт web.archive.org работает совсем плохо, поэтому я сделал кастомный хттп-модуль, который проверяет наличие сайта в новой версии "веб-архива" - waybackmachine.org).
Вот код модуля:
<wa module_name="WA-new" enabled="1" check_interval="0" retries="100" use_proxies="0" results_mode="2" download_size="999999"> <request _onBeforeRequest="HTTP_OnBeforeRequest" _onAfterRequest="HTTP_OnAfterRequest"> <server address="waybackmachine.org" port="80"/> <headers><![CDATA[GET /*/http://%URL% HTTP/1.1 Host: waybackmachine.org User-Agent: #$m$UA$m$# Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Connection: keep-alive ]]></headers> <checks> <check result="parse" present="0" icase="1" type="regexp"><![CDATA[\n\r?^HTTP/1|4.\d\s+2\d\d]]></check> <check result="good" present="1" icase="1" type="regexp"><![CDATA[The Wayback Machine is an initiative]]></check> <check result="parse" type="*"/> </checks> </request> <results> <regexps> <regexp name="%is_found%" icase="1" format="yes" default="no"><![CDATA[This calendar view maps the number of times]]></regexp> </regexps> <fields delimiter_replace="\;"> <field title="WA present" format="plain">%is_found%</field> </fields> </results> </wa>
Этот текст нужно записать в файл checkparams.xml после следующей строки:
</alexa>
Если кому интересно, могу помочь с разработкой доп.модулей под CP.
2 nipler:
хотелось бы еще, чтобы в следующих версиях модуля "Контроль" при изменениях количества исходящих ссылок на проверяемой странице эти изменения отображались в таблице с плюсом или минусом (как сейчас тиц и pr).
Щелкните на значок "Управление группами" вверху (находится посередине между "Модуль" и формой добавления нового сайта).
Мне встречались на арабском, так что, думаю, можно.
Коллеги, если кому будет интересно, выкладываю пример того что можно сделать с помощью механизма скриптов.
Например, с помощью JScript можно отсеять из результатов проверки домены, у которых PR < 3. Делается это путем замены функции OnBeforeWriteResultLine в файле checkparams.js на следующую:
function OnBeforeWriteResultLine(line) { var arrRes = line.split(';'); if (arrRes[2] < 3 || arrRes[2] == '-' ) { line = ""; } return line; }