Если автор скрипта не против, предлагаю взять эстафету из моих рук - Doorways & Cloaking

Парсер кейвордов из Яндекс Директ

HorrorTM · 2007-12-29T19:12:57.0000000Z

Что-то в последнее время часто сталкиваюсь с жалобами на недостаток ключевых слов, в связи с чем решил поделиться решением по РУ доры. Скрипт простой как молоток. В файле config.php прописываете настройки базы данных, файл key.php собственно сам парсер, в папке лежат картинки и файл стилей. Настроки перед запуском парсинга опять таки банальные и вопросов вызвать не должны. Ни разу на бан со стороны Яндекса за частые запросы не нарывался, хотя местами и наглел. [ATTACH]11266[/ATTACH] P.S. Извините, но дописывать, переделывать, затачивать под что-либо и т.д. не буду. Писал сто лет назад, а сейчас использую базу Пастухова и вполне доволен жизнью, чего и вам желаю.

376

big boy

11 января 2008, 00:11

#21

Так как автор скрипта распространяет его в открытом виде, то я взял на себя смелость немного изменить его (совсем чуток).

Изменения:

- база кейвордов записывается без количества переходов (только текст)

- кейворды записываются в выбранный вами файл, причем если файл уже существует, кеи дописываются внизу, не удаляя предыдущие записи (указывать надо полное имя файла, например так: file.txt)

- добавлены мини отчеты после парсинга: Обработан запрос: ууу и Кейвордов в файле: ххх

- данные не сбрасываются из формы после каждого парсинга, что удобнее

Скачать тут - http://f.3-a.net/download/yandex_parser2.rar

Если автор скрипта не против, предлагаю взять эстафету из моих рук и внести свои изменения в скрипт, которые могли бы улучшить его работу.

Например возможные добавления:

- парсинг пакчками, своего рода задания (вместо <input type=text> использовать <textarea>, чтобы вбивать туда нужные запросы по одному на строчке, которые будут обрабатываться по очереди)

- парсинг Что еще искали люди (добавит больше ключевиков в базу)

- лимит по максимальному количеству запросов, для сбора НЧ

- стоп слова (для исключения ненужных кейвордов)

Как вам идея, программисты? Возмемся за написания первого в мире Open Source парсера? Орять-таки если HorrorTM не против =)))

✔ Как я генерирую статьи через ИИ, которые приносят трафик - https://webmasta.ru/blog/16-vkalyvayut-roboty-ne-chelovek-stati-s-pomoschyu-ii-kotorye-prinosyat-trafik

376

big boy

11 января 2008, 00:16

#22

кстати скрипт завис при сборе популярного кея (количество запросов было больше 300.000)

банальная перегрузка?

тогда стоит добавить парсинг небольшими траншами по "мнадцать" запросов/страниц за раз

188

BLACK_DANTE

11 января 2008, 08:26

#23

А можно сделать чтобы он не с директа, а с вордастата парсил?

ЗЫ, Для особо умных комментаторов к репе сделал скрин!

В вордстате на такое никогда не нарывался.

jpg 11536.jpg

Будьте людьми.

F

15

facer

11 января 2008, 08:44

#24

Благодарю за парсер, а Вы можите сделать чтобы он сортировал по частоте на НЧ и ВЧ??

ZX

55

ZуXEL

11 января 2008, 08:53

#25

BLACK_DANTE:
А можно сделать чтобы он не с директа, а с вордастата парсил?
ЗЫ, Для особо умных комментаторов к репе сделал скрин!
В вордстате на такое никогда не нарывался.

директ и вордстат - одна конфетка, только в разных обертках:

Вордстат и Директ

*

188

BLACK_DANTE

11 января 2008, 09:03

#26

Да я прекрасно знаю что это одна конфекта, но просто в директе я вчера очень быстро нарвался на каптчу, а в вордстате не видел ни разу. Странно, но все-же...

68

Gnome

11 января 2008, 10:06

#27

BLACK_DANTE:
... сделал скрин!

Да до парсились ...

Народ еще кто-нить на капчу нарывался?

Newox.ru (http://newox.ru) - бесплатные базы кейвордов и платные выборки

188

UralM

11 января 2008, 10:44

#28

Gnome:
Народ еще кто-нить на капчу нарывался?

Да, до того как стали юзать пастухова парсили своим скриптом. Скрипту давали работать в виде: выпарсивание n количества страниц с временным промежутком t, после этого давали отдохнуть яндексоидам минут пять, после продолжали. В течении часа-двух работает нормально, а потом интересуется человекоподобностью.

Правда работали без проксей напрямую с сервака, наверное в этом причина была.

188

BLACK_DANTE

11 января 2008, 11:04

#29

Если работать через прокси, примерно 70 страниц ключевиков успевает напарсить (я все вручную делаю) Потом снова каптча лезет... надо постоянно IP менять, но думаю это не выход..

68

Gnome

11 января 2008, 11:18

#30

Выход - выход, ip да куки, больше ни хрена они сделать не могут)))

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Что делать, чтобы попасть в ответы Google Bard

Парсер кейвордов из Яндекс Директ