zamm, я о webground.su спрашивал.
Получается, они не в количестве обрабатываемых источниках считают?
Источники могут быть любыми заданными?
800 гривен== 100 уе
А что входит в максимальный вариант?
Ну вот моя конкретика.
Тематика тут ни при чем. Неважно что мониторить и парсить.
Заказать (у меня) такое регулярное обновление стоило бы не меньше 5 уе в месяц за один источник (точнее даже не источник, а один тип материалов. Т.е. если на сайте есть новости, статьи, прес-релизы и что-то еще в разных шаблонах, то настраивать==оплачивать надо каждый разный шаблон).
При этом раз в 2 часа проверял бы информацию (или наверное даже можно сделать программу, чтобы заказчик смогу ее запускать когда ему надо).
Алгоритм программы был бы следующим: программа будет дергать гугль по всем нужным запросам + site:нужныСайт, результат отсортированный по времени. Так получим все самые свежие статьи.
Ну и программа будет их парсить, и например на почту отправлять. Или же просто в файлик сохранять.
Или можете свой вариант предложить.
Вообще эта штука достаточно замороченная получается. Поэтому меня интересовала бы обработка не меньше 20 ресурсов.
Получается, мониторинг и парсинг 20 сайтов стоил бы около 100 уе в месяц. Такая вот конкретика.
Насчет сервиса.
Если бы можно было настроить доставание с нужных вам ресурсов новой информации по нужным запросам. Скажем, все новые статьи по нужным вам запросам в полном виде будут приходить вам на почту.
Сколько бы вы были готовы платить за такой мониторинг одного конкретного ресурса в месяц?
* Всего источников: 4009
Думаю, если им напишете они без проблем добавят пару десятков новых источников.
SergijKo добавил 25.11.2010 в 16:12
Пришла идея.
Как вариант можно использовать кастомный поисковик гугля (и в яндекса вроде тоже аналогичная штука есть).
Выбираете поиск по каким площадкам вам нужен (если их действительно пару десятков нужных), и получите поиск только по ним.
Так проверяя этот свой поисковик точно получите информацию о новых статьях в тему запроса.
Ну а потом уж ручками все-таки доставать (или же можете заказать автоматическую доставалку инфы из самых обновляемых ресурсов).
http://webground.su/services.php?param=sendmail - это можете попробовать. По описанию что-то похожее на нужное.
Pipes не волшебная палочка. Если грубо, это просто штука которая позволяет непрограммистам автоматизировать свои действия (причем предоставляет намного меньше средств, чем может использовать программист). Поэтому если даже программист не видит алгоритм, то с ней и подавно не решить такие задачи.
SergijKo добавил 25.11.2010 в 15:03
Поиск наибольшего блока текста (одна достаточно известная реализация "парсинга" любой неизвестной страницы) не особо рабочее решение. Или вы не про то?
SergijKo добавил 25.11.2010 в 15:05
И кстати, о реализации.
Вспомнил - тут кто-то пару лет продвигал достаточно серьзный сервис как раз для того, чтобы мониторить все новые материалы по нужному запросу.
Идея была точно такая как вам надо - сервис все полные тексты как-то предоставлял.
Название сервиса пока не вспомнил...
Можно настроить полный парсинг определенных ресурсов, но парсинг случайного ресурса (а вылезти в новостях может вообще любой сайт) на полном автомате (т.е. без каких-либо предварительных подстроек под него) это уже из области искусственного интеллекта.
Буду очень рад если кто аргументированно возразит - если есть алгоритм обработки случайного ресурса, с удовольствием его реализую.
Копипаст - 1 000 страниц 1-5 уе (но общая цена заказа не меньше 40 уе).
Обращайтесь, ася 474 279 549.