Сервис для новостей на сайт

1 2345 6
L
На сайте с 15.03.2010
Offline
0
#31

По нефти и газу можно?

D
На сайте с 18.02.2010
Offline
2
#32
lucene:
По нефти и газу можно?

Можно: http://digester.ru/RSS.aspx?n=GAZOIL

Такое подходит?

L
На сайте с 15.03.2010
Offline
0
#33
Digester:
Можно: http://digester.ru/RSS.aspx?n=GAZOIL
Такое подходит?

По сути похоже, только иногда попадаются очень похожие статьи, с этим что-то можно сделать? И еще можно ли, например, давать не полный текст статьи, а аннотацию?

D
На сайте с 18.02.2010
Offline
2
#34
lucene:
По сути похоже, только иногда попадаются очень похожие статьи, с этим что-то можно сделать? И еще можно ли, например, давать не полный текст статьи, а аннотацию?

Да, похожие статьи могут попадаться и как уменьшить количество повторов - я говорил уже в этой ветке. Но зная, что не все любят листать форум назад - скажу еще раз. Можно, и даже желательно создавать не просто запрос на Газ и Нефть, а при желании составлять что-то более конкретное. Например, можно ограничить запрос некоторыми источниками, или же добавить какие-либо ключевые слова. Тогда некоторые дубликаты само-собой пропадут.

На самом деле, полностью исключить похожие документы не так просто. Например, если есть две новости на одну тему и одна новость содержит только краткую информацию, а другая более подробную. Какую из этих двух новостей выдавать? Они обе обо одном и том же, количество слов, примерно одинаковое, оба источника достаточно известные... Пока не прочитаешь новость - не поймешь какую из них можно выкинуть, а какую оставить. А так как, все автоматизировано и поставлено на поток - это надо как-то делать программно. Мы пока работаем над этой проблемой, и если у вас есть какие-то предложения, мы с радостью их рассмотрим.

От себя добавлю, что пока, мы рассматриваем вариант, составления списка приоритетных источников...

Что касается вопрос с аннотациями, то ответ - ДА. Мы можем давать вам аннотация вместО распарсированного текста или вместЕ с текстом в отдельном теге. Примеры аннотаций вы можете посмотреть на нашем сайте. Если вам устраивает получать аннотации, что в свою очередь гарантирует некоторую уникальность - то мы можем давать вам их. Просто в заявке укажите, что желаете получать аннотации таким-то способом...

nouhau
На сайте с 16.02.2010
Offline
36
#35

а можно ленту по автомобильной тематики

nouhau добавил 25.03.2010 в 01:32

почему нет ответа?

nouhau добавил 25.03.2010 в 01:49

почему нет ответа?

D
На сайте с 18.02.2010
Offline
2
#36
nouhau:
а можно ленту по автомобильной тематики

nouhau добавил 25.03.2010 в 01:32
почему нет ответа?

nouhau добавил 25.03.2010 в 01:49
почему нет ответа?

Да, можно...

http://digester.ru/RSS.aspx?n=AUTO

Можно так же немного ограничить область запроса, например, брать только новости связанные со словом "Концепт"

А ответа не было потому, что в 01:32 люди обычно уже спят :)

[Удален]
#37

почему в каналах нет картинок и текст неотформатирован?

Таггу x_x
На сайте с 31.10.2005
Offline
425
#38

Делал похожий сервис (http://rss20.ru) пару-тройку лет назад, от нечего делать, через пол-года в баню :D По началу трафа огрёб хорошо, и даже появились пользователи, кто ставил себе импорт, но потом всё накрылось пи... медным тазом. До сих пор в бане, хоть там и нету уже самих новостей. Забил. А вам удачи, помню, что было очень увлекательно все это кодить :) Но проблема в том, что есть Яндекс.Новости, которые это делают.

☠️☠️☠️
D
На сайте с 18.02.2010
Offline
2
#39
ants:
почему в каналах нет картинок и текст неотформатирован?

Текст не отформатирован, потому что это RSS. Мы можем напихать туда тегов, но считаем, что это личное дело каждого. Если посмотрите, то в текст есть разметка /n /t - ничего не мешает вам их заменить на <br> и будет все отлично.

Пока никто на это не жаловался. Но если этого будет не хватать, то мы всегда сможем выдавать текст с тегами. Просто в данном случае к вам приходит полностью готовый и распарсированный от всякого мусора текст.

Картинки мы можем тоже вытаскивать из новостей, но это уже более авторская вещь, нежели распарсированный текст. Но думаю, что мы можем давать в RSS ссылку на картинку, которая располагается на сайте источнике.

Пока это под вопросом. На начальном этапе мы даем только чистый текст. Если хотите, мы можем в RSS прикрепить ссылку на изображение...

Digester добавил 25.03.2010 в 16:34

Tarry:
Делал похожий сервис (http://rss20.ru) пару-тройку лет назад, от нечего делать, через пол-года в баню :D По началу трафа огрёб хорошо, и даже появились пользователи, кто ставил себе импорт, но потом всё накрылось пи... медным тазом. До сих пор в бане, хоть там и нету уже самих новостей. Забил. А вам удачи, помню, что было очень увлекательно все это кодить :) Но проблема в том, что есть Яндекс.Новости, которые это делают.

Интересный ресурс...

Вот несколько замечаний (поправьте если не так):

- Яндекс.Новости не дает полный текст новостей и я не нашел как сделать так, чтобы по моему запросу мне сформировали определенный RSS

- Ваш сервис дает (давал) информеры (как я понял), но не дает сам RSS, с которым пользователь мог бы делать все, что ему вздумается. Но думаю раз вы сделали такое - то не трудно сделать чистый RSS. И плюс ваш сервис так же не давал полный текст.

- Сейчас по-моему уже сложно найти то, чего еще нет. Но никогда не поздно создать что-то лучше того, что существует. У нас есть технология, работу которой можно увидеть на сайте. Так почему бы ее не использовать для чего-то еще... Что мы, собственно, мы здесь и предлагаем.

Надеюсь, не чем не обидел...

юни
На сайте с 01.11.2005
Offline
922
#40

По таким ключам много новостей?

Астрогеодезия
Аэрономия
Вулканология
Геоинформатика
Геоморфология
Геостатистика
Геотехнология
Гидрология
Гидрология суши
Лимнология
Русловедение
Океанология
Гляциология
Землеустройство
Климатология
Кристаллография
Океанография
Палеогеография
Палеоокеанология
Палеоклиматология
Палеонтология
Петрология
Петрография
Петрофизика
Седиментология
Сейсмология
Стратиграфия
Тектоника

По какой теме больше всего?

Планируется отдавать результат в разных форматах, начиная с текстового? Обработкой (уникализацией) новостей не хотите заняться?

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий