Парсер кейвордов из Яндекс Директ

1 2345 6
big boy
На сайте с 18.11.2006
Offline
358
#21

Так как автор скрипта распространяет его в открытом виде, то я взял на себя смелость немного изменить его (совсем чуток).

Изменения:

- база кейвордов записывается без количества переходов (только текст)

- кейворды записываются в выбранный вами файл, причем если файл уже существует, кеи дописываются внизу, не удаляя предыдущие записи (указывать надо полное имя файла, например так: file.txt)

- добавлены мини отчеты после парсинга: Обработан запрос: ууу и Кейвордов в файле: ххх

- данные не сбрасываются из формы после каждого парсинга, что удобнее

Скачать тут - http://f.3-a.net/download/yandex_parser2.rar

Если автор скрипта не против, предлагаю взять эстафету из моих рук и внести свои изменения в скрипт, которые могли бы улучшить его работу.

Например возможные добавления:

- парсинг пакчками, своего рода задания (вместо <input type=text> использовать <textarea>, чтобы вбивать туда нужные запросы по одному на строчке, которые будут обрабатываться по очереди)

- парсинг Что еще искали люди (добавит больше ключевиков в базу)

- лимит по максимальному количеству запросов, для сбора НЧ

- стоп слова (для исключения ненужных кейвордов)

Как вам идея, программисты? Возмемся за написания первого в мире Open Source парсера? Орять-таки если HorrorTM не против =)))

✔ Как я генерирую статьи через ИИ, которые приносят трафик - https://webmasta.ru/blog/16-vkalyvayut-roboty-ne-chelovek-stati-s-pomoschyu-ii-kotorye-prinosyat-trafik
big boy
На сайте с 18.11.2006
Offline
358
#22

кстати скрипт завис при сборе популярного кея (количество запросов было больше 300.000)

банальная перегрузка?

тогда стоит добавить парсинг небольшими траншами по "мнадцать" запросов/страниц за раз

BLACK_DANTE
На сайте с 24.03.2007
Offline
188
#23

А можно сделать чтобы он не с директа, а с вордастата парсил?

ЗЫ, Для особо умных комментаторов к репе сделал скрин!

В вордстате на такое никогда не нарывался.

jpg 11536.jpg
Будьте людьми.
F
На сайте с 04.01.2008
Offline
15
#24

Благодарю за парсер, а Вы можите сделать чтобы он сортировал по частоте на НЧ и ВЧ??

ZX
На сайте с 05.08.2006
Offline
55
#25
BLACK_DANTE:
А можно сделать чтобы он не с директа, а с вордастата парсил?
ЗЫ, Для особо умных комментаторов к репе сделал скрин!
В вордстате на такое никогда не нарывался.

директ и вордстат - одна конфетка, только в разных обертках:

Вордстат и Директ

*
BLACK_DANTE
На сайте с 24.03.2007
Offline
188
#26

Да я прекрасно знаю что это одна конфекта, но просто в директе я вчера очень быстро нарвался на каптчу, а в вордстате не видел ни разу. Странно, но все-же...

Gnome
На сайте с 29.09.2005
Offline
68
#27
BLACK_DANTE:
... сделал скрин!

Да до парсились ...

Народ еще кто-нить на капчу нарывался?

Newox.ru (http://newox.ru) - бесплатные базы кейвордов и платные выборки
UralM
На сайте с 07.08.2006
Offline
188
#28
Gnome:
Народ еще кто-нить на капчу нарывался?

Да, до того как стали юзать пастухова парсили своим скриптом. Скрипту давали работать в виде: выпарсивание n количества страниц с временным промежутком t, после этого давали отдохнуть яндексоидам минут пять, после продолжали. В течении часа-двух работает нормально, а потом интересуется человекоподобностью.

Правда работали без проксей напрямую с сервака, наверное в этом причина была.

BLACK_DANTE
На сайте с 24.03.2007
Offline
188
#29

Если работать через прокси, примерно 70 страниц ключевиков успевает напарсить (я все вручную делаю) Потом снова каптча лезет... надо постоянно IP менять, но думаю это не выход..

Gnome
На сайте с 29.09.2005
Offline
68
#30

Выход - выход, ip да куки, больше ни хрена они сделать не могут)))

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий