Subudayj

Subudayj
Рейтинг
67
Регистрация
24.06.2008
gasyoun:
Subudayj, запустил, круто. Это получается успевай только кейворды для парсипнга подставлять? Прога стучит каждому из, скажем, 40 датацентров сотнями потоков сразу и за 15 минут может выдать 100к доменов с пейджранком и номером телефона из хуизов?

Про whois не скажу, а вот пейджранк легко за 1млн+ в час можно прочекать при условии большого количества относительно хороших проксей.

Могу помочь с написанием чего-то подобного на основе CheckParams

gasyoun:
Особенно интересна скорость работы.

Это статистика проверки PR, скорость еще не такая высокая из-за отсутствия свободных проксей :)

Threads: 1000/1000, speed: 309.98 urls/sec., work time: 336 sec., urls processed: 98511, urls failed: 15, urls remains: 0

Google-PR: Checks: 111351, successful: 98496, failed: 6567, bans: 601, free proxies: 0, blocked proxies: 411, using now: 1000

PLU engine: threads: 100/100, sources: 3, source proxies: 0, good: 1411, deleted: 0, checking: 0

Script engine: queued tasks: 0

Traffic incoming: 301169 Bps, outgoing: 204635 Bps; CPU usage total: 11.41%, program: 1.09%

Memory: working set: 143020032, pagefile usage: 162484224, Handles: 6437

AlikZP:
ДваждыДва, ну рушки да, все уходят на аукционы. А com, net и прочие?
Мало-мальски нормальный - ключ, с показателями, в индексе, в вебархиве и тп

com, .net, .org с нормальныйми показателями уходят Snap, NJ и так далее

+ куча народу сидит со своими скриптами, и "долбит" реселлерский API у разных зарубежных регистраторов.

У особо продвинутых есть некие отношения напрямую с регистраторами, что дает им преимущество.

Можно на CheckParams что-то подобное написать:

/ru/forum/511667

Коллеги, если кому интересно, выкладываю код модуля для проверки наличия сайта в "веб-архиве" (как вы, наверное, заметили, в последнее время сайт web.archive.org работает совсем плохо, поэтому я сделал кастомный хттп-модуль, который проверяет наличие сайта в новой версии "веб-архива" - waybackmachine.org).

Вот код модуля:


<wa module_name="WA-new" enabled="1" check_interval="0" retries="100" use_proxies="0" results_mode="2" download_size="999999">
<request _onBeforeRequest="HTTP_OnBeforeRequest" _onAfterRequest="HTTP_OnAfterRequest">
<server address="waybackmachine.org" port="80"/>
<headers><![CDATA[GET /*/http://%URL% HTTP/1.1
Host: waybackmachine.org
User-Agent: #$m$UA$m$#
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Connection: keep-alive

]]></headers>
<checks>
<check result="parse" present="0" icase="1" type="regexp"><![CDATA[\n\r?^HTTP/1|4.\d\s+2\d\d]]></check>
<check result="good" present="1" icase="1" type="regexp"><![CDATA[The Wayback Machine is an initiative]]></check>
<check result="parse" type="*"/>
</checks>
</request>
<results>
<regexps>
<regexp name="%is_found%" icase="1" format="yes" default="no"><![CDATA[This calendar view maps the number of times]]></regexp>
</regexps>
<fields delimiter_replace="\;">
<field title="WA present" format="plain">%is_found%</field>
</fields>
</results>
</wa>

Этот текст нужно записать в файл checkparams.xml после следующей строки:

</alexa>

Если кому интересно, могу помочь с разработкой доп.модулей под CP.

2 nipler:

хотелось бы еще, чтобы в следующих версиях модуля "Контроль" при изменениях количества исходящих ссылок на проверяемой странице эти изменения отображались в таблице с плюсом или минусом (как сейчас тиц и pr).

war357159:
При попытке добавить нового пользователя, ругается на то, что "модуль и группа должны быть выбраны".

Модуль выбран, но в поле выбора группы - пустота. Как эти группы создать можно?

Щелкните на значок "Управление группами" вверху (находится посередине между "Модуль" и формой добавления нового сайта).

Buzi-Vuzi:
Можно в Text-Link-Ads применять анкоры на греческом? ресурс на гр. и продвигать в google.gr нужно. Без движений с внутренней стороны ресурса.

Мне встречались на арабском, так что, думаю, можно.

Коллеги, если кому будет интересно, выкладываю пример того что можно сделать с помощью механизма скриптов.

Например, с помощью JScript можно отсеять из результатов проверки домены, у которых PR < 3. Делается это путем замены функции OnBeforeWriteResultLine в файле checkparams.js на следующую:

function OnBeforeWriteResultLine(line)

{
var arrRes = line.split(';');
if (arrRes[2] < 3 || arrRes[2] == '-' )
{
line = "";
}
return line;
}
Всего: 288