Продаю парсер текстов с Google News

US
На сайте с 07.02.2010
Offline
1
1159

Прога парсит выдачу Google News за 1990-2010 годы по Вашему ключевику, заходит по ссылкам, берет полный текст статьи с сайтов. Выдача Google парсится с задержкой для избежания бана (могу добавить прокси), сайты парсятся в 30 потоков (можно изменить).

По кею "еда" спарсилось 400мб текста в UTF ~= 200мб в Win кодировке.

Сейчас прога работает в десктопном режиме, при желании могу сделать серверный вариант, добавить расписание.

Цена 50 WMZ.

Для покупки обращаться на upitersoft gmail.com.

Разработка софта (парсеры, автореги и т.д.)
Georgyi
На сайте с 01.03.2009
Offline
135
#1

Такую херню на фриланс-бирже можно в 2 раза дешевле заказать (недавно подобное заказывал). Какого фига покупать ее за 50?

Georgyi добавил 08.02.2010 в 09:04

Цену баксов 15-20 назначьте. Или просто поделитесь с народом бескорыстно. :)

SEO-блог без воды: ZenPR.ru (http://zenpr.ru) --> Гугл сам говорит тебе, где ставить ссылки (http://zenpr.ru/gugl-sam-govorit-tebe-gde-stavit-ssyl/) – ты только ставь
stev
На сайте с 21.06.2009
Offline
151
#2

Нолик из цены убрать и снимать каймак. )

Палим приватные темы ➔ Slivup.Biz (http://goo.gl/Etp8gO) Прокси: 1 IP от 16 руб. 5 дней здесь (https://vk.cc/akA6wg).
moneySEO
На сайте с 20.10.2009
Offline
170
#3
UpiterSoft:
(могу добавить прокси)

Без прокси парсер не стоит и 3-х долларов.

гугл внесет ваш IP в спам базу очень быстро.

Сервис быстрой индексации ссылок в Google: https://moneyseo.info/speedy-index
US
На сайте с 07.02.2010
Offline
1
#4
Georgyi:
Такую херню на фриланс-бирже можно в 2 раза дешевле заказать (недавно подобное заказывал). Какого фига покупать ее за 50?

Берите у школьников на фриланс-бирже за копейки, не вопрос.

moneySEO:
Без прокси парсер не стоит и 3-х долларов.
гугл внесет ваш IP в спам базу очень быстро.

Гугл не вносил мой IP в спам базу, при круглосуточном парсинге. При достаточной задержке он этого никогда не сделает.

Задержка на гугле не тормозит весь процесс, т.к. основное время уходит на парсинг 50к статей, на которые указывает гугл.

Если есть реальное желание купить, но не устраивает цена - пишем на мыло.

moneySEO
На сайте с 20.10.2009
Offline
170
#5

UpiterSoft, можно парсить на английском и других языках?

US
На сайте с 07.02.2010
Offline
1
#6
moneySEO:
UpiterSoft, можно парсить на английском и других языках?

заточено под кирилицу, если нужен другой язык - сделаю

BLACK_DANTE
На сайте с 24.03.2007
Offline
188
#7

Парсит в один файл или как? Чисто или "грязно" ? Пример нескольких статей можно увидеть в личку?

Будьте людьми.
US
На сайте с 07.02.2010
Offline
1
#8
BLACK_DANTE:
Парсит в один файл или как? Чисто или "грязно" ? Пример нескольких статей можно увидеть в личку?

Сейчас кидает все в один файл, могу сделать что б в отдельные.

Оставляет только текст (без HTML)

Сейчас в личку отправлю кусок того что спарсил

S
На сайте с 12.11.2009
Offline
13
#9

ээ, лично мне прога не нужна, но

Google News за 1990-2010 годы по Вашему ключевику, заходит по ссылкам, берет полный текст статьи с сайтов

вот то, что болдом, стоит несколько сотен зелени, однако, неизвестно как это реализовано у ТС, если всё так и есть, то это даже очень неплохой "универсальный" парсер.

ИМХО, ТС, нужно выложить скрины, примеры спарсенных текстов и оригиналы сайтов (урлов страниц) откуда парсилось.

зы: возможно, стоит отдать прогу за отзыв какому-либо заинтересованному мемберу с форума с большой репой, разумеется если найдёшь, у кого ещё нет универсалки )

snatch добавил 08.02.2010 в 13:29

snatch:
стоит несколько сотен зелени

мда, разумеется, если в качестве источника, спайдер будет кормить алгоритм определения текста статей, с любых сайтов

то есть, отдаёшь список урлов сайтов, на выходе получаешь все статьи с этих источников

US
На сайте с 07.02.2010
Offline
1
#10
snatch:
ээ, лично мне прога не нужна, но
Google News за 1990-2010 годы по Вашему ключевику, заходит по ссылкам, берет полный текст статьи с сайтов
вот то, что болдом, стоит несколько сотен зелени, однако, неизвестно как это реализовано у ТС, если всё так и есть, то это даже очень неплохой "универсальный" парсер.
ИМХО, ТС, нужно выложить скрины, примеры спарсенных текстов и оригиналы сайтов (урлов страниц) откуда парсилось.

зы: возможно, стоит отдать прогу за отзыв какому-либо заинтересованному мемберу с форума с большой репой, разумеется если найдёшь, у кого ещё нет универсалки )

snatch добавил 08.02.2010 в 13:29

мда, разумеется, если в качестве источника, спайдер будет кормить алгоритм определения текста статей, с любых сайтов
то есть, отдаёшь список урлов сайтов, на выходе получаешь все статьи с этих источников

Так и есть, парсер находит текст статьи, чистит от HTML. При желании скормить список URL можно не только с Google News. Правильно находит текст статьи в 95%+ случаев. Сейчас складывает все в 1 файл (мне было нужно именно так), но если кому-то нужно в разные - это менять 5 минут.

Скрины, примеры сделаю чуть позже.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий