Софт для парсинга кеев. Вопрос.

12
response
На сайте с 01.12.2004
Offline
324
#11
Solo_by:
парсилка топпера парсит в нужном диапозоне (от и до) в отличие от того же анадыря или магадана

не смешите. Узнать смещение страницы по "верхнему" диапазону для кея не представляется возможным, не сканируя все страницы от самого начала (можно лишь сократить траф, дискретно сканируя выдачу, но овчинка не стоит выделки). Задать "нижний" диапазон в Магадане можно.

Кстати, не все догоняют, но в Магадане можно поставить нижний диапазон заведомо высоким, и просто прочекать все кеи из очереди, которые свалятся в <префикс>-family.txt, не включая связанные кеи.

Иногда людям даны все возможности, но пока носом не ткнешь, они не начинают думать.

ТС, немного подумать, и выкачать все нужные кеи по нижнему диапазону (как я выше написал, от этого никуда не деться), а затем засунуть все в Эксель, где все это отлично сортируется и вырезается без строчки кода. Как говорит один мой знакомый, "Знай и люби свой Офис". Дел на пять минут. Вы денвер для скрипта дольше развертывать будете.

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
Perfect_Dima
На сайте с 10.12.2009
Offline
26
#12


<?
$file="scaner_10_01_2010.txt"; //Файл с кеями(в этой же папке, в ANSI)
$min=22; //минимальное кол-во запросов
$max=910; //максимальное кол-во запросов
$f=fopen($file,r);
$key=fread($f,655360);
$f=fclose($f);


$keys = explode("\n", $key);

$k=0;
for($i=0; $i<10000; $i++){
list($word,$count)= spliti(":", $keys[$i]);
if($count>=$min && $count<=$max){
$k++;
echo "$word<br>";}
}


echo "<br><br>Найдено $k ключей";
?>

Взято с какого-то блога, уже не помню с какого 🍿

ciber
На сайте с 04.01.2008
Offline
215
#13

всегда пользовался базой Пастухова, чего и вам советую.

Solo_by
На сайте с 19.06.2009
Offline
220
#14

response, я имел ввиду частотность по вордстату, тупо ту цифру которую он пишет справа от кея.

response:
дискретно сканируя выдачу

вы физмат не заканчивали?

response
На сайте с 01.12.2004
Offline
324
#15
Solo_by:
response, я имел ввиду частотность по вордстату, тупо ту цифру которую он пишет справа от кея.

я именно про нее и говорю. опишите подробнее ваше виденье различий в алгоритмах Магадана и парсилки Топпера, ибо я перечитываю, и не теряю уверенности, что мы говорим об одном и том же.

парсилка Топпера, машина Тьюринга, пушка Гаусса 😂

Solo_by:
вы физмат не заканчивали?

а че, я не к месту вспомнил дискретность? :)

Solo_by
На сайте с 19.06.2009
Offline
220
#16
response:
я именно про нее и говорю. опишите подробнее ваше виденье различий в алгоритмах Магадана и парсилки Топпера, ибо я перечитываю, и не теряю уверенности, что мы говорим об одном и том же.

В анадыре есть чекбокс с выбором либо верхней границы либо нижней, мне показалось именно это смущало тс и он искал прогу где можно задать и верхнюю и нижнюю границу частотности. Именно так можно сделать в парсилке топпера)

response:
парсилка Топпера, машина Тьюринга, пушка Гаусса

ага, вылны Эллиота, клетка Жордана, полином Лопиталя.. пуговица Пушкина ;)

response:
а че, я не к месту вспомнил дискретность?

да нет, просто интересуюсь.

Georgyi
На сайте с 01.03.2009
Offline
135
#17

База Пастухова - лучшее решение.

SEO-блог без воды: ZenPR.ru (http://zenpr.ru) --> Гугл сам говорит тебе, где ставить ссылки (http://zenpr.ru/gugl-sam-govorit-tebe-gde-stavit-ssyl/) – ты только ставь
L!mur
На сайте с 26.06.2006
Offline
176
#18
Georgyi:
База Пастухова - лучшее решение.

Ага, еще бы Max ее обновил, как обещал еще пол года назад ☝

10'000 руб/сутки на SEDv4 «MobyDick»! (/ru/forum/comment/12653555) Нужен трафик? Купи «SED» (http://www.sedv4.ru) 5'000 руб/сутки на SEDv3 (/ru/forum/comment/11641425) Для работы с Twitter только TwiFarmv3! (/ru/forum/839117)
response
На сайте с 01.12.2004
Offline
324
#19
Solo_by:
В анадыре есть чекбокс с выбором либо верхней границы либо нижней, мне показалось именно это смущало тс и он искал прогу где можно задать и верхнюю и нижнюю границу частотности. Именно так можно сделать в парсилке топпера)

ну тогда точно об одном и том же говорили :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий