Сервис для новостей на сайт

D
На сайте с 18.02.2010
Offline
2
#41
юни:
По таким ключам много новостей?

На самом деле вал лучше самому проверить это... Достаточно зайти на сайт www.digester.ru и вбить эти слова в поиск. За весь период больше всего "Землеустройство".

юни:
Планируется отдавать результат в разных форматах, начиная с текстового?

Да, планируется. Планируется вообще отдавать в разных форматах. Для этого, если сервис признают нужным и полезным будет на нашем сайте создан личный кабинет, в котором каждый сможет создавать запросы. Пока это не автоматизировано, и все мы делаем сами вручную (имеется ввиду RSS канал).

юни:
Обработкой (уникализацией) новостей не хотите заняться?

Конечно, хотим! Если только вы объясните, что это такое :) Меня слова местами и заменять некоторые синонимами? Это? Просто пока наш текст не может являться уникальным, т.к. его уже кто-то написал. А вот аннотации у нас могут быть уникальными (их можно посмотреть на сайте, именно аннотации показываются под ссылками).

юни
На сайте с 01.11.2005
Offline
933
#42
Digester:
Меня слова местами и заменять некоторые синонимами?

Желательно поплотнее, конечно. Переписать новость своими словами, например.

Но это в будущем, сейчас народ справляется своими силами, скорее всего.

И да, проект интересен. Особенно, если будет уделяться должное внимание поискам новых источников информации (и особенно - на редкие темы).

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
D
На сайте с 18.02.2010
Offline
2
#43
юни:
Желательно поплотнее, конечно. Переписать новость своими словами, например.

Но это в будущем, сейчас народ справляется своими силами, скорее всего.

Вообще, мы стараемся все делать автоматически... Руками то новости мы не пишем :)

На что значит поплотнее?

Ведь суть сервиса в том, чтобы людям не писать ничего, а чисто положиться на автоматизацию. Если нам для каждого запроса писать новость руками, то это уже не бесплатно получится, и долго :)

Digester добавил 25.03.2010 в 19:55

юни:
И да, проект интересен. Особенно, если будет уделяться должное внимание поискам новых источников информации (и особенно - на редкие темы).

У нас сейчас примерно 450 источников... Список мы периодически пополняем. Стараемся не брать источники, которые делают полный копи-паст и ничего своего не пишут. Плюс мы берем только те, у кого есть RSS. И все наши источники рабочие, чего не скажешь о источниках того же самого Яндекса...

Таггу x_x
На сайте с 31.10.2005
Offline
445
#44
Digester:
Ваш сервис дает (давал) информеры (как я понял), но не дает сам RSS, с которым пользователь мог бы делать все, что ему вздумается.

Давал, и сейчас даёт, только новости уже не свежак, кроны отрублены в прошлом году. :)

А кстати, чуть не забыл! Его единокровный брат до сих пор в строю, но на буржуйском поле :) Там как раз можно посмотреть как это всё было в оригинале, сюжетирование новостей (сборка похожих заметок в сюжет), последние, главные новости, и прочее. Эх, жаль мне лень уже всем этим заниматься... http://www.trimnews.com/

☠️☠️☠️
юни
На сайте с 01.11.2005
Offline
933
#45
Tarry:
http://www.trimnews.com/

Попса какая-то... по geology - одна ссылка.

Digester, кстати - англоязычные ресурсы не планируете подключить?

D
На сайте с 18.02.2010
Offline
2
#46
юни:
Попса какая-то... по geology - одна ссылка.

Digester, кстати - англоязычные ресурсы не планируете подключить?

Вообще, в планах такое есть...

Людей пока для этого не хватает...

Digester добавил 25.03.2010 в 20:50

Tarry:
Давал, и сейчас даёт, только новости уже не свежак, кроны отрублены в прошлом году. :)

А кстати, чуть не забыл! Его единокровный брат до сих пор в строю, но на буржуйском поле :) Там как раз можно посмотреть как это всё было в оригинале, сюжетирование новостей (сборка похожих заметок в сюжет), последние, главные новости, и прочее. Эх, жаль мне лень уже всем этим заниматься... http://www.trimnews.com/

Сайт похож на ваш... Один движок? Или один скопировал дизайн у другого?

D
На сайте с 18.02.2010
Offline
2
#47

Мы произвели кое-какие изменения в сторону избавления от "похожих" статей... Теперь, так называемых "дублей" станет меньше...

Z
На сайте с 29.11.2008
Offline
10
#48

У вас появился индекс цитирования, который как-то странно работает. Например, если сравнивать с данными, публикуемыми Медиалогией, то видна очень большая разница по топовым источникам. Ну с Интерфаксом (не путать с Интерфакс-Украина) то понятно, почему его нет. А Итар-Тасс и Regnum где?

на 2ое апреля имеем:

organization: "Regnum" meta: -(300001F) - 351 новость

organization: "Интерфакс" meta: -(300001F) - 558 новостей

organization: "Итар-Тасс" meta: -(300001F) - 491 новость

D
На сайте с 18.02.2010
Offline
2
#49
Zoltrix:
У вас появился индекс цитирования, который как-то странно работает. Например, если сравнивать с данными, публикуемыми Медиалогией, то видна очень большая разница по топовым источникам. Ну с Интерфаксом (не путать с Интерфакс-Украина) то понятно, почему его нет. А Итар-Тасс и Regnum где?

на 2ое апреля имеем:
organization: "Regnum" meta: -(300001F) - 351 новость
organization: "Интерфакс" meta: -(300001F) - 558 новостей
organization: "Итар-Тасс" meta: -(300001F) - 491 новость

Здравствуйте, очень рады, что вы обратили внимание на один из наших последних сервисов. Но, вынужден Вас огорчить, к сожалению вы неверно составили запросы. Скорее всего это связано с тем, что некорректно поняли назначение слова meta:. Данное слово у нас пока не задокументировано, но оно используется в некоторых запросах, в частности в Индексе цитируемости. Словом META, у нас так обозначается источник, причем в скобках указывается его уникальный ID. Соответственно, если перед скобками стоит МИНУС, то этот источник должен быть исключен из результатов поиска. Таким образом мы получаем Индекс цитирования, а именно - все документы, содержащие название источника, но при этом в качестве источника это название выступать не может.

Если вы хотите получить индекс цитирования для Регнум, то запрос будет следующий:

organization: "Regnum" meta: -(3000018) (сейчас это менее 10 документов)

ID (что указали Вы) = 300001F - принадлежит Коммерсанту. Таким образом вы искали документы, где упоминался Регнум по всем источникам кроме Коммерсанта.

Почему-то Ругнум мало кто цитирует, кроме него самого :)

В Медиалогии - мы вообще не нашли Индекс цитирования, точнее нашли общий ИЦ за месяц, но там в ТОП нет тех источников, что указали вы.

На всякий случай мы проверили еще раз на ИЦ, и у нас он работает абсолютно исправно...

А почему вам понятно, почему у нас нет Интерфакса?

Z
На сайте с 29.11.2008
Offline
10
#50
Digester:
Здравствуйте, очень рады, что вы обратили внимание на один из наших последних сервисов. Но, вынужден Вас огорчить, к сожалению вы неверно составили запросы. Скорее всего это связано с тем, что некорректно поняли назначение слова meta:. Данное слово у нас пока не задокументировано, но оно используется в некоторых запросах, в частности в Индексе цитируемости. Словом META, у нас так обозначается источник, причем в скобках указывается его уникальный ID. Соответственно, если перед скобками стоит МИНУС, то этот источник должен быть исключен из результатов поиска. Таким образом мы получаем Индекс цитирования, а именно - все документы, содержащие название источника, но при этом в качестве источника это название выступать не может.
Если вы хотите получить индекс цитирования для Регнум, то запрос будет следующий:
organization: "Regnum" meta: -(3000018) (сейчас это менее 10 документов)
ID (что указали Вы) = 300001F - принадлежит Коммерсанту. Таким образом вы искали документы, где упоминался Регнум по всем источникам кроме Коммерсанта.
Почему-то Ругнум мало кто цитирует, кроме него самого :)
В Медиалогии - мы вообще не нашли Индекс цитирования, точнее нашли общий ИЦ за месяц, но там в ТОП нет тех источников, что указали вы.

На всякий случай мы проверили еще раз на ИЦ, и у нас он работает абсолютно исправно...

А почему вам понятно, почему у нас нет Интерфакса?

Посмотрите тут: http://www.mlg.ru/smi/ratings/1587/

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий