Парсер поисковых систем

SS
На сайте с 09.07.2006
Offline
6
1034

Модуль Spambase обновился до версии 1.0

Разработали абсолютно новый движок для Spambase и добились очень высоких скоростей: на Shared хостинге в 25 потоков при парсинге Google около 24к ресурсов в минуту при парсинге Yahoo около 17к (парсинг без проверки ресурсов по запросам типа inurl:guestbook, inurl:blog и т.д.). К сожалению, движок парсера MSN пока не закончен, поэтому текущая версия скрипта позволяет работать только с Yahoo и Google.

Основные характеристики скрипта:

- многопоточность;

- парсинг Google и Yahoo;

- проверка отпарсеных ресурсов (наличие форм, пригодна ли форма для спама, поиск ссылок на форму, определение PR и т.д.);

- экспорт данных;

- скрипт почти не использует прокси (используются в случае парсинга больше 500к ресурсов по Yahoo в сутки).

- возможность проверки собственных баз;

- отправка сообщения об окончании парсинга на e-mail.

На данный момент не решен вопрос с демо-доступом, т.к. если давать скрипт на тесты даже на 30 минут, то можно успеть собрать базу в 400-600к ресурсов :) Скриншоты интерфейса можно будет посмотреть на сайте.

Цена модуля 70$ (с последующими бесплатными обновлениями).

Segey
На сайте с 23.08.2005
Offline
404
#1
SEO Studio:
Цена модуля 70$

И вы думаете кто-то это купит?

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)
SS
На сайте с 09.07.2006
Offline
6
#2
Segey:
И вы думаете кто-то это купит?

Посмотрим :). Аналогов по скорости работы пока вроде нет.

Gordon01
На сайте с 21.05.2006
Offline
12
#3

Что он делает-то. Собирает спам базу? Так тут вроде такое не любят

Проблемы с сервером? Не та кодировка в MySQL? 404? Настройка VPS/VDS (forum.searchengines.ru/showthread.php?t=69437)
Segey
На сайте с 23.08.2005
Offline
404
#4

Gordon01,

необязательно, для обмена тоже можно. Хотя для обмена есть специальные сайты

Gordon01
На сайте с 21.05.2006
Offline
12
#5

А как его для обмена пристроить-то? Ссылки обратные проверять?

Segey
На сайте с 23.08.2005
Offline
404
#6
Gordon01:
А как его для обмена пристроить-то? Ссылки обратные проверять?

да нет, базу мыл собирать. Хотя в таких объемах, ты прав, только для спама, имхо :)

Gordon01
На сайте с 21.05.2006
Offline
12
#7

Ну да-да, пусть собирают. Советую начать с http://mfteam.org/userlist.php

S
На сайте с 06.02.2006
Offline
85
#8

Gordon01, вах, как нихарашо!!! :)

Знакомый скриптик, на Ibresource.ru случаем не сидите? а то там вроде theIgg такой скриптик выкладывал для спамеров

С уважением, Хорев Андрей (http://www.khorev.net/)
Gordon01
На сайте с 21.05.2006
Offline
12
#9

Я его очеь давно взял с промофорума. Люболю поспамить спамеров. Благое дело

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий