!Иван FXS

!Иван FXS
Рейтинг
119
Регистрация
16.11.2001

Дык, вопрос-то не про сами утилиты, а - про их каталоги!

То есть я ищу не какую-то КОНКРЕТНУЮ утилиту, которая "должна решать какую-то задачу", а - каталоги, которые - если они ХОРОШИЕ каталоги, - наверное, должены базироваться на какой-то ЭФФЕКТИВНОЙ классификации задач ...

Впрочем, возможно, это не более, чем моя хотелка ... Ну, как грится, отрицательный результат - тоже результат ...

НП, Иван FXS.

Как писал Miha Kuzmin

Я не понял, а куда они должны вести - на ирреальные страницы ? :)

Сорри, Вы понимаете разницу между:

"сугубо заглавие, анонс и сам текст новости"

и HTML-страницей?

Как писал Miha Kuzmin

Может быть, а на самом деле какая разница ?

Э-эээээ ... "разница" есть или ее нет - зависит от конкретных задач, которые решает тот или иной ындивид, ок?

НП, Иван FXS.

Здравствуйте.

Сейчас мне стало казаться странным

то, что писал InSAn

Нечто специальное.
Новости поставляются по договоренности с поисковиками.
Причем, поставляются "чистые" - т.е. сугубо заглавие, анонс и сам текст новости.

- ведь все новости в разделах "News" поисковиков имеют при себе УРЛы, которые ведут на РЕАЛЬНЫЕ HTML-страницы!

Может быть "договоренности с поисковиками" (точнее - договоренности поисковиков с ИНФОРМ-АГЕНСТВАМИ) состоят просто в том, что поисковики ЧАСТО индексируют контент, выкладываемый этими агенствами?

Тогда, получается, раздел "News" - это просто специальным образои отобраная и представленная часть ЕДИНОЙ базы поисковика???

НП, Иван FXS .

Как писал NULL
мечтает о неком АРМ для SEO.

Глоссарий бы не помешал ... Что такое SEO?

НП, Иван FXS.

Как писал Vyacheslav Tikhonov

Посмотрите этот обзор новостных поисковиков и сделайте выводы.

Кстати, насчет Вашей статьи: лидер сменился и весьма радикально.

Посмотрите запросы

http://cgi.wn.com/?SearchString=dollar&template=worldnews%2Findex.txt&action=search&first=0&mode=and&language=English&sortby=Date_Newest&searchsize=10

и

http://www.altavista.com/news/search?q=dollar&nc=0&nr=0&ns=0&nd=5&d0=01%2F01%2F90&d1=01%2F01%2F04&avkw=xytx

- Altavista хранит в полтора раза больше новостей, чем WordNews (бывший NewsFind), 140 тысяч против 95!

НП, Иван FXS.

Как писал Vyacheslav Tikhonov

Не совсем понятно, в чем конкретно заключается вопрос. Если автоматизированный сбор неструктурированной информации, такой, как новости и статьи, то это -
news clipping.

Вопрос - про существующие в ы-нете, работающие и свободно доступные "News Search Engines": какие из них - самые лучи-чи-чие? Например, - самые "глубокие" ...

За "news clipping" - спасибо, для меня это - совершенно новый термин ...

Я посмотрю , куда с ним "посылает" Google, но можете Вы - в двух словах, по-русски и на пальцах - рассказать, что это такое?

НП, Иван FXS.

Как писал* baikal-boy

Да почему же не живут. Живут. Обычно, каждая новость имеет вполне полноценое "место жительства" ...

Ага, место ВРЕМЕННОГО жительства.

Откройте, к примеру,

http://web.archive.org/web/*/http://story.news.yahoo.com/news?tmpl=story2&ncid=*

или

http://web.archive.org/web/*/http://biz.yahoo.com/prnews/02*

- и попробуйте хоть одну из этих новостей сейчас обнаружить на Yahoo!

А с индексацией, как мне кажется, тут ничего особенного - просто ее нужно делать как можно чаще.

Конечно, Вы правы, только ... спрашивал-то я про другое: про РЕАЛЬНО существующие проекты. То есть даже не про проЖекты, и тем более - не про то, как "нужно делать" ;-)

Тем не менее - спасибо за ответ.

НП, Иван FXS.

___________________

* Мне вот это "Как писал" пришлось ручками вставлять, а другие постящие - интересно - как вставляют?

М-да ... похоже, эта тема не слишком интересует данное сообщество.

Может быть кто-нибудь посоветует хорошую статью со сравнительным анализом "News Search Engines", или хотя бы ... куда пойти, где поспрашивать?

НП, Иван FXS .

Паранойя, по моему я тебя знаю Ты у Нелли не обитаешь ?

Или на fxai? ;-)

Мне нужна инфа, основы работы таких систем, чтоб сформулировать конкретное свое видение и передать на разработку спецам...

Имхо, Вы описали задачу слишком специфическую и узкую, - для того, чтобы можно было говорить об "основах" да еще "таких систем" (в множественном числе!) ...

Вот как Вы описали - так она (они?) и должна работать:

Список сайтов которые надо посещать, формируется вручную.
...
Искать заданные словосочетания, в темах, в тексте. Заданные по списку.
...
а может сама ищет сайты, типа поискового робота.
...
Правила обработки текстов, поиска, включения сайта в один из списков обработки.
...
Сортирует по дате, по сайту, по вычисленной информативности текста. Складывает туда, куда скажут.

- вот именно так она и должна работать, какие еще "основы"?

Так и ставьте задание программистам, чего тут непонятного?

НП, Иван FXS .

Но только кажеться мне, что люди для своих целей пишут не одну большую и универсальную программу, а создают(или скачивают) некие тулзы, которые потом и работают.

Дык, MS Access - это в моем понимании и есть та "большая и универсальная* программа", которую надо не писать самому, а просто освоить и использовать.

А вот как Вы будете обеспечивать, чтобы надерганные из разных месты тулзы "работали скопом" - это мне не понятно!

НП, Иван FXS.

_______________

* универсальная - умеет, например, вызывать IE, "посылать" его по нужному адресу и забирать у него то, что он на этом адресе надыбал.

Всего: 644