Парсер кеев с Wordstat.Yandex "eXlusive psW"

123 4
[Удален]
#11
Выслушаю пожелания, что хотели бы увидеть в будущих версиях.

- удаление дублей;

- парсинг похожих ключей

- убирать знак "+" автоматом

- указание какой разделитель ставить ; , : , пробел, табуляция

- прикрутить ********у для разгадывания капч

- прикрутить функцию конвертации в windows1251

IN
На сайте с 23.01.2010
Offline
67
#12
falkhan:
- прикрутить ********у для разгадывания капч

Вы уверены, что это надо? Я запускаю парсер вообще без задержек и никаких зависаний и капч не получал (отслеживаю в снифере, что скрипт получает в ответ).

falkhan:
- парсинг похожих ключей

Как вы это видите: в отдельный файл все похожие кеи (как в магадане) или иначе как-то?

[Удален]
#13

то что надо. когда обнова ? заряжу на хостинге на пару месяцев и будет БАЗА )

TopperHarley
На сайте с 24.03.2009
Offline
350
#14

ТС красавчег, еще нужно только не писать в вывод дубли и убирать +

PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )
[Удален]
#15
TopperHarley:
ТС красавчег, еще нужно только не писать в вывод дубли и убирать +

это уже писали. в каждую щель со своим глючным софтом в подписи лезешь.

TopperHarley
На сайте с 24.03.2009
Offline
350
#16

[offtopic]кто голодного троля выпустил? почему без намордника? :)[/offtopic]

[Удален]
#17

У меня в папке /out текстовый файл не зодраётся в результате парсинга :(

права на папки /task и /out точно выставлны 777

что может быть?

хостинг дорогой и нормальный

Soft
На сайте с 22.06.2008
Offline
34
#18

- указание какой разделитель ставить ; , : , пробел, табуляция

Думаю, выбор разделителя будет самый оптимальный вариант


Как вы это видите: в отдельный файл все похожие кеи (как в магадане) или иначе как-то?

Видимо имелось в виду как в магадане, считаю не нужной функцией, лучше самому составить основные кей, буде меньше мусора.


На счет формата вывода: планировал сделать возможность создания csv файла для работы в excel, но как вариант оставлю предложенный формат.

Если будет выбор разделителей, то надобность в этом отпадёт, например, если сохранить txt с табуляцией, то достаточно будет переименовать fail.txt в fail.xlc и он будет корректно отображаться в Excel


На счет "не парсит" не понял, у меня ни разу капча не вылезла, возможно, это перегрузка wordstat, в новой версии я предусмотрю это.

Остановка может быть по двум причинам:

- действительно перегрузка, днём вордстат часто в дауне.

- капча. По личному опыту, капча появляется при большом количестве запросов и при смене куки. Если зайти на вордстат и пообновлять куки, то при новых запросах можно увидить капчу. От ip не зависит.

[Удален]
#19
antiparked.ru:
У меня в папке /out текстовый файл не зодраётся в результате парсинга

Всё заработало :)

IN
На сайте с 23.01.2010
Offline
67
#20
doorgay:
когда обнова ?

сегодня вечером сяду делать, а там как пойдет (:

Soft:
лучше самому составить основные кей, буде меньше мусора

эти кеи будут в отдельный файл класться

Soft:
например, если сохранить txt с табуляцией, то достаточно будет переименовать fail.txt в fail.xlc и он будет корректно отображаться в Excel

спасибо за наводку, я этого не знал, так и сделаю.

Soft:
Остановка может быть по двум причинам

хоть убейте, второй причины ни разу не встречал, я погоняю парсер, но если не выскочит ни разу, то не буду писать подгрузку капчи.

antiparked.ru:
Всё заработало

наверное, сервер wordstat был в дауне.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий