Q: поиск по новостям

12
!Иван FXS
На сайте с 16.11.2001
Offline
119
943

Здравствуйте.

Почти на всех поисковиках сейчас имеется раздел "News", - как устроен этот поиск? Ведь новости - как контент - принципиально отличаются от "обычных" страниц, поскольку страницы новостей либо "динамические", либо имеют очень специфический короткоживущие адреса типа

www`agenstvo`com/.../2003/05/30/abrakadabra`htm

?

Более конкретно: база, на которой выполняются запросы раздела "News" - это та же основная база поисковика или нечто специальное?

НП, Иван FXS .

InSAn
На сайте с 13.01.2003
Offline
60
#1
база, на которой выполняются запросы раздела "News" - это та же основная база поисковика или нечто специальное

Нечто специальное.

Новости поставляются по договоренности с поисковиками.

Причем, поставляются "чистые" - т.е. сугубо заглавие, анонс и сам текст новости.

ADPRO - Мы знаем, что Вам нужно! (http://adpro.ua)
!Иван FXS
На сайте с 16.11.2001
Offline
119
#2

Известно ли кому-нибудь что-нибудь про проекты индексации потоков* новостей для целей трэйдинга?

НП, Иван FXS .

____________________

* потоков - потому, что новости (в отличие от "обычного" контента) долго на одном "месте" не живут, но быстро куда-то "утекают" ;-)

!Иван FXS
На сайте с 16.11.2001
Offline
119
#3

М-да ... похоже, эта тема не слишком интересует данное сообщество.

Может быть кто-нибудь посоветует хорошую статью со сравнительным анализом "News Search Engines", или хотя бы ... куда пойти, где поспрашивать?

НП, Иван FXS .

BB
На сайте с 25.03.2002
Offline
31
#4
Как писал !Иван FXS
Известно ли кому-нибудь что-нибудь про проекты индексации потоков* новостей для целей трэйдинга?
* потоков - потому, что новости (в отличие от "обычного" контента) долго на одном "месте" не живут, но быстро куда-то "утекают" ;-)

Да почему же не живут. Живут. :) Обычно, каждая новость имеет вполне полноценое "место жительства", страницу, доступ к которой обеспечивается через архив, структурированный хронологически и тематически. В этом своем понимании новость ничем не отличается от обычной статьи.

Но, кроме того, каждая новость какое то время принимает участие и в потоке, упомянутом Вами - обычно, это список свежих новостей.

Что касается поиска в потоках, то, как мне кажется, здесь есть одна ярковыраженная особенность - возможность и необходимость учета в ранжировании результатов поиска коэффициента, основанного на свежести и актуальности этой новости - это и дата ее публикации, и заданный период, во время которого новость актуальна и т.п.

А с индексацией, как мне кажется, тут ничего особенного - просто ее нужно делать как можно чаще. Новости ведь, как-никак. :)

aktex.ru - аккумуляторный информационный портал (http://www.aktex.ru/)
VT
На сайте с 27.01.2001
Offline
130
#5
Может быть кто-нибудь посоветует хорошую статью со сравнительным анализом "News Search Engines", или хотя бы ... куда пойти, где поспрашивать?

Не совсем понятно, в чем конкретно заключается вопрос. Если автоматизированный сбор неструктурированной информации, такой, как новости и статьи, то это -

news clipping.

!Иван FXS
На сайте с 16.11.2001
Offline
119
#6

Как писал* baikal-boy

Да почему же не живут. Живут. Обычно, каждая новость имеет вполне полноценое "место жительства" ...

Ага, место ВРЕМЕННОГО жительства.

Откройте, к примеру,

http://web.archive.org/web/*/http://story.news.yahoo.com/news?tmpl=story2&ncid=*

или

http://web.archive.org/web/*/http://biz.yahoo.com/prnews/02*

- и попробуйте хоть одну из этих новостей сейчас обнаружить на Yahoo!

А с индексацией, как мне кажется, тут ничего особенного - просто ее нужно делать как можно чаще.

Конечно, Вы правы, только ... спрашивал-то я про другое: про РЕАЛЬНО существующие проекты. То есть даже не про проЖекты, и тем более - не про то, как "нужно делать" ;-)

Тем не менее - спасибо за ответ.

НП, Иван FXS.

___________________

* Мне вот это "Как писал" пришлось ручками вставлять, а другие постящие - интересно - как вставляют?

!Иван FXS
На сайте с 16.11.2001
Offline
119
#7

Как писал Vyacheslav Tikhonov

Не совсем понятно, в чем конкретно заключается вопрос. Если автоматизированный сбор неструктурированной информации, такой, как новости и статьи, то это -
news clipping.

Вопрос - про существующие в ы-нете, работающие и свободно доступные "News Search Engines": какие из них - самые лучи-чи-чие? Например, - самые "глубокие" ...

За "news clipping" - спасибо, для меня это - совершенно новый термин ...

Я посмотрю , куда с ним "посылает" Google, но можете Вы - в двух словах, по-русски и на пальцах - рассказать, что это такое?

НП, Иван FXS.

VT
На сайте с 27.01.2001
Offline
130
#8
Вопрос - про существующие в ы-нете, работающие и свободно доступные "News Search Engines": какие из них - самые лучи-чи-чие? Например, - самые "глубокие" ...

Посмотрите этот обзор новостных поисковиков и сделайте выводы.

VT
На сайте с 27.01.2001
Offline
130
#9
За "news clipping" - спасибо, для меня это - совершенно новый термин ...
Я посмотрю , куда с ним "посылает" Google, но можете Вы - в двух словах, по-русски и на пальцах - рассказать, что это такое?

news clipping или news monitoring - специализированные сервисы, предназначенные для сбора и хранения новой информации - новостей, пресс-релизов, статей и т.д. На Западе используются, как правило, для того, чтобы всегда быть в курсе того, что о компании пишет пресса, мониторинга деятельности конкурентов, отслеживания событий и тенденций на различных рынках и т.д.

Суть сервиса - вы подписываетесь на новостные потоки, идущие с интересующих новостных сайтов, определяете нужные ключевые слова и темы, и получаете только отсортированную информацию, представляющую какой-то интерес. В России это в какой-то мере реализовано в подписке Яндекс-Новостей.

Polite Moose
На сайте с 22.04.2002
Offline
85
#10
Как писал !Иван FXS
Как писал* baikal-boy


___________________
* Мне вот это "Как писал" пришлось ручками вставлять, а другие постящие - интересно - как вставляют?

ЭТО возникает при ответе кнопкой "цитата" внизу-справа нужного сообщения.

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий