Мультикейвордный парсер яндекса

12
I
На сайте с 19.12.2007
Offline
106
1656

Мне написали под заказ чудо-парсер яндекс.директа. Аналогов пока не встречал. Получился один из лучших на сегодняшний день. Готов поменяться на деньги или на что-нибудь хорошее, с условием не перепродавать. Написан на PHP+AJAX. Код открытый.

Вот что он умеет:

-принимает сразу несколько кейвордов для парсинга;

-умеет обходить капчу рандомным sleep() или через прокси;

-очищает напарсенное по списку стоп-слов. Указываем в текстовом файле список нежелательных слов (порно, скачать и т.д.), и все кеи содержащие эти слова пускаются под нож.

-встроенная кеемешалка;

-разбивка напарсенного на указанное количество страниц;

-сохранение в указанной папке в файлах, название которых представляет собой транслитерацию кея по которому происходил парсинг + номер части на которые напарсенное было разбито. Т.е. название файлов с кеями идеально подходит в качестве названия поддоменов для доров.

Тестировался на локалхосте (win xp, apache, php5) и на сервере freebsd, nginx,php5

Описание:

Логически он разбит на 2 блока - блок сбора кеев и блок отображения статуса.

Блок сбора кеев запускается, когда жмешь кнопку "go", после чего браузер перебрасывается на блок отображения статуса. При этом блок сбора кеев продолжает работать, пока не обработает все слова. При обработке слов, первый блок после каждого нового обработанного целиком слова записывает в xparser.st новый текст. Блок отображения статуса циклом через ajax опрашивает содержимое этого файла и выводит на экран.

IDLE = скрипт может начать работу.

BUSY = Скрипт работает.

DONE = Скрипт завершил работу

после того, как нажимаешь go устанавливается статус BUSY|x~y, где x - число обработанных уже слов, y - общее число слов

когда блок отображения статуса видит статус DONE, от выбрасывает на экран окошко с отчетиком

и при этом происходит перевод скрипта в статус IDLE

Скрины: http://beststars.ru/parser.jpg

Главная фишка:

если после нажатия go закрыть окно браузера, и допустим на следующий день зайти на скрипт браузером на экран вывалится отчетик, т.к. скрипт работает независимо от того открыто окно или нет. Когда отработает, переводится в статус DONE и пока ты не просмотришь отчетик, в статус IDLE он не перейдет.

Т.е. можно на дедик его закинуть с огромным числом ключевых слов, выключать комп и идти спать.

Прокси:

Файл с проксями должен быть большим + надежным. Если половина проксей битая - лучше просто использовать режим sleep. Прокси из листа берутся рандомно. Битые прокси повторно не используются.

Прошу ваши предложения в ПМ, или в аську 98-31-30 (часто в инвизибле. лучше в офф).

Закрытая партнёрка по Push трафику. (https://pushsender.pro) Инвайт: NR9LSZ89
ГА
На сайте с 21.12.2006
Offline
128
#1

На тест можно? Если понравится - пропиарю. ;)

I
На сайте с 19.12.2007
Offline
106
#2
Гайдамака Артем:
На тест можно? Если понравится - пропиарю. ;)

Хорошо. Я буду только рад, если человек с репутацией выскажет своё мнение. Отписал в ПМ.

ZX
На сайте с 05.08.2006
Offline
55
#3

софт - бойан. пишется за 5 минут с использованием открытой ф-ии, которая валяется в инете на каждом шагу. (без учета проксей и аякса, который там и нах не нужен.)

*
I
На сайте с 19.12.2007
Offline
106
#4

не все программеры! А в готовом виде ничего похожего не валяется.

response
На сайте с 01.12.2004
Offline
324
#5
Intdig:
не все программеры! А в готовом виде ничего похожего не валяется.

сколько вы за него заплатили, если не секрет?

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
XB
На сайте с 27.03.2006
Offline
77
#6

Все довольно просто с точки зрения программирования.

А вообще ничего так, если недорого. Поздравляю ТС с удачным приобретением. :)

Анкор ищет себе хозяина с красивым урлом (http://).
ZX
На сайте с 05.08.2006
Offline
55
#7

Кому интересно - здесь: http://alexusblog.com/post/useful-for-seo-php-classes-and-functions.html есть ф-ия для парсинга, после маленькой конструкции в пшп, и тюнинга самой ф-ии - на выходе имеем почти вышеописанное чудо.

D
На сайте с 29.11.2007
Offline
138
#8
ZуXEL:
Кому интересно - здесь: http://alexusblog.com/post/useful-for-seo-php-classes-and-functions.html есть ф-ия для парсинга, после маленькой конструкции в пшп, и тюнинга самой ф-ии - на выходе имеем почти вышеописанное чудо.

Я вот не прогер и мне ничего это не говорит к сожалению😒

Intdig:
Мне написали под заказ чудо-парсер яндекс.директа. Аналогов пока не встречал. Получился один из лучших на сегодняшний день. Готов поменяться на деньги или на что-нибудь хорошее, с условием не перепродавать. Написан на PHP+AJAX. Код открытый.
Вот что он умеет:
-принимает сразу несколько кейвордов для парсинга;
-умеет обходить капчу рандомным sleep() или через прокси;
-очищает напарсенное по списку стоп-слов. Указываем в текстовом файле список нежелательных слов (порно, скачать и т.д.), и все кеи содержащие эти слова пускаются под нож.
-встроенная кеемешалка;
-разбивка напарсенного на указанное количество страниц;
-сохранение в указанной папке в файлах, название которых представляет собой транслитерацию кея по которому происходил парсинг + номер части на которые напарсенное было разбито. Т.е. название файлов с кеями идеально подходит в качестве названия поддоменов для доров.

Тестировался на локалхосте (win xp, apache, php5) и на сервере freebsd, nginx,php5

Описание:
Логически он разбит на 2 блока - блок сбора кеев и блок отображения статуса.
Блок сбора кеев запускается, когда жмешь кнопку "go", после чего браузер перебрасывается на блок отображения статуса. При этом блок сбора кеев продолжает работать, пока не обработает все слова. При обработке слов, первый блок после каждого нового обработанного целиком слова записывает в xparser.st новый текст. Блок отображения статуса циклом через ajax опрашивает содержимое этого файла и выводит на экран.
IDLE = скрипт может начать работу.
BUSY = Скрипт работает.
DONE = Скрипт завершил работу
после того, как нажимаешь go устанавливается статус BUSY|x~y, где x - число обработанных уже слов, y - общее число слов
когда блок отображения статуса видит статус DONE, от выбрасывает на экран окошко с отчетиком
и при этом происходит перевод скрипта в статус IDLE

Скрины: http://beststars.ru/parser.jpg

Главная фишка:
если после нажатия go закрыть окно браузера, и допустим на следующий день зайти на скрипт браузером на экран вывалится отчетик, т.к. скрипт работает независимо от того открыто окно или нет. Когда отработает, переводится в статус DONE и пока ты не просмотришь отчетик, в статус IDLE он не перейдет.
Т.е. можно на дедик его закинуть с огромным числом ключевых слов, выключать комп и идти спать.

Прокси:
Файл с проксями должен быть большим + надежным. Если половина проксей битая - лучше просто использовать режим sleep. Прокси из листа берутся рандомно. Битые прокси повторно не используются.

Прошу ваши предложения в ПМ, или в аську 98-31-30 (часто в инвизибле. лучше в офф).

За сколько продадите???😕

ZX
На сайте с 05.08.2006
Offline
55
#9
dava:
За сколько продадите???😕

Тоже интересно.

п.с. Просто инетересно, и не более, сколько на этом срубили.

G4
На сайте с 11.03.2006
Offline
125
#10

Меня тоже заинтересовало, наверное дешевле чем база пастухова, и вопрос на засыпку - толк от таких кеев, которые яндекс сам обрезает, не все выдает и тд..

Выкупаем места на крупных фильмовых и игровых сайтах!!ДОРОГО!!. Стучите 58five275.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий