Такое подойдет? :) : http://digester.ru/RSS.aspx?n=MUSICIAN
Если что-то не так... Можете замечания писать сюда.
1. Наверное у нас разные понятия слова "уникальность". Говоря про уникальность, имело ввиду не уникальность текста, а уникальность новостей. Т.е. мы стараемся исключать одинаковые новости.
2. Вы запросили целую рубрику. Если вы зайдете на сайт и выберете рубрику HiTech, то увидите там сюжеты новостей, которые к ней относятся. В сюжете есть так же несколько новостей. Все новости берутся из открытых источников, и уникальности в тексте новости нет. Это верно. Стоит одному издательству написать, как куча других эту новость перепишут, а то и просто скопируют. Мы новости сами не пишем. Уникальным у нас является только аннотация к новости, которую можно посмотреть на сайте под каждым заголовком новостей. Если хотите, мы можем вам давать аннотации, но они все-равно состоят из предложений основного текста новости. Поэтому если брать по предложению, то уникальности не будет. А если считать уникальным полностью аннотацию к новости - то да, мы считаем ее уникальной.
3. Насчет смысла новостей... Такие же новости будут гнать программы и скрипты, которые грабят тексты новостей по RSS каналам. Ничего нового, они не сделают. Нашим плюсом перед ними является то, что пользователям ничего лишнего делать не надо. Все делается само и приходит к вам в руки. Качество сервиса на прямую зависит от этого форума. Мы только начинаем его создавать и если вы предложите лучшее ему применение, мы будет только вам признательны. Пока кроме, как предлагать вам тексты новостей по вашим запросам - мы ничего не можем. Если есть желание, мы можем из сюжета (в котором несколько документов) сформировать вам документ, который будет состоять из предложений аннотаций. Получится "абра-кадабра", которая будет "кое-как" относится к сюжету, но читать пользователю её будет не легко... Зато этот текст будет уникальным (ведь он состоит из не менее чем из 5-ти других документов). Может быть это для чего-то и пригодится (например для раскрутки), мы пока не знаем...
4. А вообще, если сделать более-менее конкретный запрос, в который включить например выбор источников, или ключевых слов, то получится вполне приемлемый канал. Который можно поместить на свой сайт, и автоматом публиковать новости у себя. Ведь именно это и предлагают различного рода RSS граберы для сайтов? Мы можем давать вам по одной новости из сюжета, но тогда вопрос будет следующим: по каким критериям выбирать ту или иную новость из сюжета? Ведь одно агентство напишет так, а другое по-другому... Одно агентство напишет новость утром, но она будет состоять из 2 строк, а другое - напишет через час, но у него будет в тексте 40 строк. К сожалению, мы не знаем, что именно может потребоваться пользователю, поэтому и создали данную ветку на форуме для обсуждения сервиса...
Ну тогда посмотрите по ссылке, что я дал вам выше... Это наш сервис, который выдает новости по вашему запросу... Более подробно описано в ветке форума. Для примера, могу вам посоветовать пройти по ссылке: www.digester.ru/RSS.aspx?n=TEST - это все новости за последние 10 дней, в которых упоминается слово "Билайн". С полученным RSS вы можете делать все, что угодно.
Этот запрос надо вбить на сайте Digester.ru И посмотреть результат. Если документы, которые выдаст пользователь понравятся, то мы можем создать отдельный RSS канал. Таким образом, каждый раз, когда кто-то будет обращаться к этому RSS-каналу, сможет получать те документы, которые удовлетворяют условиям запроса.
А обязательно скрипт?
Вот тут сервис есть получения любых новостей по RSS: /ru/forum/461733
Добрый день... Начнем с того, что указанные продукты - требуют настройки и наладки. Если источник новостей поменял HTML, то не факт, что новость придет так как надо, и вам придется менять свой шаблон для этого сайта. Да, такое происходит не так часто, но происходит. В нашем случае, если поменяется HTML - то это уже наша забота. А единственные настройки которые вам нужно будет сделать - это грамотно составить запрос. В будущем мы планируем сделать более удобную систему запросов, нежели сейчас на сайте. Ну и главный плюс, это то, что сейчас у нас все бесплатно, без каких-либо "НО".
Digester добавил 15.03.2010 в 18:09
Возможно. Вот, например, простой пример запроса: музыкант (выступления ИЛИ тур ИЛИ концерт). Зайдите на сайт digester.ru и вбейте там этот запрос. Устраивают ли вас полученные результаты? Запрос можно подкорректировать: например исключить какие-либо источники, или наоборот, выбрать только те источники, по которым вы хотели бы получать документы.
Что-то как-то неактивно :( Неужели данный сервис так уж бесполезен?
К сожалению, пока не могу дать ответа на ваш вопрос. Пока мы предлагаем данный сервис совершенно бесплатно. Но как и говорилось ранее, все кто будет как-то помогать нам в развитии сервиса, может рассчитывать на бонусы :)
А вообще, в планах сделать сервис доступный всем, как по ценам, так и по удобствам.
Digester добавил 12.03.2010 в 15:43
А вот теперь я могу дать ответ на вопрос, относительно оплаты.
Сейчас регистрация и пользование сервисом будет бесплатным. Т.е. все кто регистрируется сейчас в будущем так и будут пользоваться базовым сервисом будут без каких-либо дополнительных плат. Единственный обязательным условием для этого будет наличие на странице с новостями ссылки на сайт digester.ru (Что-то типа: "Сервис предоставлен сайтом Digester.ru").
Ну что? Такой расклад устраивает? :)
Digester добавил 12.03.2010 в 15:48
Сейчас исправили небольшую ошибку с датами.
Да, это возможно, т.к. мы мониторим сразу кучу источников. Если находим дубликаты - отсеиваем. В данном случае новости действительно разные, одна может дополнять другую. Я бы назвал эти новости "похожими". Приведу пример: Вот в 15-30 появилась новость о том, что кто-то ограбил магазин. Новость появилась в RSS. Через пол часа стали известны подробности этого происшествия. Об этом написало другое агентство в 15-50, ну и естественно с предысторией. А значит уже есть похожесть с новостью в 15-30. Дальше в 16-40 милиция нашла грабителей и об этом написало еще одно агентство. Если так смотреть, то все новости похожие получаются. Сюжет один, а новости разные. Как быть в таком случае? Это же RSS, если новость до вас дошла в 15-30, то например, 16-30 - новость от 15-30 никуда не денется. Мы пока не придумали какую новость из сюжета удалить, а какую оставить... Ведь каждое издательство пишет что-то свое, а значит там может быть что-то новое, чего не написали в предыдущей новости.
В данном тестовом RSS очень много источников, и запрос очень простой. Сразу понятно, что он выдаст большое количество результатов. В нашем случае здесь новости упорядочены по времени (самые свежие наверху). Чтобы как-то сократить количество дубликатов - можно дополнить запрос источниками. Т.е. можно выбрать определенные источники, документы которых вы хотите получать. Или же наоборот исключить некоторые источники.
Надуюсь объяснил я понятно :) и не запутал вас своим примером.
На самом деле, мы уже думали о проблеме с "дублями", но пока этот вопрос не решен. Тем не менее мы готовы принять ваши идеи, для решения данной проблемы.
Все документы отсортированы по дате. Самые свежие сверху. У тестового запроса мы выставили ограничение в 50 документов и диапазон дат последние 10 дней. Если выдавать все документы за весь срок, то это будет очень много. Даже на сайте у нас стоит ограничение в 1000 документов.
В том то и дело, что отдает полную новость.
Полный текст лежит в теге description, мы решили туда его класть. Помимо полного текста, мы можем давать и аннотации, но тогда полный текст придется помещать в тег, что-то вроде fulltext.
Мы пока начинаем тестирование, и если большинство будет просить убрать текст из тега description куда-нибудь в другое место, то скорее всего так и сделаем.
А пока, можете заказывать для своих сайтов запросы.
Как и обещал, выкладываю пример RSS, полученный результатом выполнения запроса: "Билайн OR Beeline": http://digester.ru/RSS.aspx?n=TEST