SergijKo

Рейтинг
111
Регистрация
13.06.2005

zamm, я о webground.su спрашивал.

юни:
Ну, они ещё могут индивидуальную рассылку или сервис предоставить, но я пока не вникал в подробности.

Получается, они не в количестве обрабатываемых источниках считают?

Источники могут быть любыми заданными?

юни:
Вариант, в принципе.

Кстати, webground.su начал тестовую рассылку присылать - пока толком не глядел, но по первому впечатлению тексты адекватные.

Максимальный вариант у них 600 гривен в месяц стоит, это сколько в рублях/долларах?

800 гривен== 100 уе

А что входит в максимальный вариант?

юни:
SergijKo, заказчику проще ориентироваться на сумму, которую ему нужно будет отдавать, без вникания в технические нюансы. Так что, без конкретики (о такой-то тематикике, таких-то донорах в таком-то числе, и таком-то количестве обращений к ним в сутки) разговаривать предметно достаточно трудно.

Ну вот моя конкретика.

Тематика тут ни при чем. Неважно что мониторить и парсить.

Заказать (у меня) такое регулярное обновление стоило бы не меньше 5 уе в месяц за один источник (точнее даже не источник, а один тип материалов. Т.е. если на сайте есть новости, статьи, прес-релизы и что-то еще в разных шаблонах, то настраивать==оплачивать надо каждый разный шаблон).

При этом раз в 2 часа проверял бы информацию (или наверное даже можно сделать программу, чтобы заказчик смогу ее запускать когда ему надо).

Алгоритм программы был бы следующим: программа будет дергать гугль по всем нужным запросам + site:нужныСайт, результат отсортированный по времени. Так получим все самые свежие статьи.

Ну и программа будет их парсить, и например на почту отправлять. Или же просто в файлик сохранять.

Или можете свой вариант предложить.

Вообще эта штука достаточно замороченная получается. Поэтому меня интересовала бы обработка не меньше 20 ресурсов.

Получается, мониторинг и парсинг 20 сайтов стоил бы около 100 уе в месяц. Такая вот конкретика.

Насчет сервиса.

Если бы можно было настроить доставание с нужных вам ресурсов новой информации по нужным запросам. Скажем, все новые статьи по нужным вам запросам в полном виде будут приходить вам на почту.

Сколько бы вы были готовы платить за такой мониторинг одного конкретного ресурса в месяц?

* Всего источников: 4009

Думаю, если им напишете они без проблем добавят пару десятков новых источников.

SergijKo добавил 25.11.2010 в 16:12

Пришла идея.

Как вариант можно использовать кастомный поисковик гугля (и в яндекса вроде тоже аналогичная штука есть).

Выбираете поиск по каким площадкам вам нужен (если их действительно пару десятков нужных), и получите поиск только по ним.

Так проверяя этот свой поисковик точно получите информацию о новых статьях в тему запроса.

Ну а потом уж ручками все-таки доставать (или же можете заказать автоматическую доставалку инфы из самых обновляемых ресурсов).

http://webground.su/services.php?param=sendmail - это можете попробовать. По описанию что-то похожее на нужное.

юни:
SergijKo, например, Брокен ещё два года назад решал массу задач через Pipes.

Там в рубрике ещё много всяких примеров

Pipes не волшебная палочка. Если грубо, это просто штука которая позволяет непрограммистам автоматизировать свои действия (причем предоставляет намного меньше средств, чем может использовать программист). Поэтому если даже программист не видит алгоритм, то с ней и подавно не решить такие задачи.

SergijKo добавил 25.11.2010 в 15:03

HraKK:
95% есть. но в случае подробной новости

Поиск наибольшего блока текста (одна достаточно известная реализация "парсинга" любой неизвестной страницы) не особо рабочее решение. Или вы не про то?

SergijKo добавил 25.11.2010 в 15:05

И кстати, о реализации.

Вспомнил - тут кто-то пару лет продвигал достаточно серьзный сервис как раз для того, чтобы мониторить все новые материалы по нужному запросу.

Идея была точно такая как вам надо - сервис все полные тексты как-то предоставлял.

Название сервиса пока не вспомнил...

Можно настроить полный парсинг определенных ресурсов, но парсинг случайного ресурса (а вылезти в новостях может вообще любой сайт) на полном автомате (т.е. без каких-либо предварительных подстроек под него) это уже из области искусственного интеллекта.

Буду очень рад если кто аргументированно возразит - если есть алгоритм обработки случайного ресурса, с удовольствием его реализую.

Копипаст - 1 000 страниц 1-5 уе (но общая цена заказа не меньше 40 уе).

Обращайтесь, ася 474 279 549.

Всего: 202