Report

F
На сайте с 29.11.2003
Offline
1
1025

А какой-нить поисковик умеет после запроса сформировать отчет с рефератами близких по смыслу документов (при ограничении размера отчета) с выделением наиболее значимых терминов?

// wbr
BUFO
На сайте с 15.06.2003
Offline
224
#1
Как писал folio
А какой-нить поисковик умеет после запроса сформировать отчет с рефератами близких по смыслу документов (при ограничении размера отчета) с выделением наиболее значимых терминов?

Ничего не понял: запроса - какого? документов - каких? отчета - какого? терминов - каких?

Я бы вместе со словом реферат написал интересующую меня тематику, или воспользовался поиском в базе рефератов

:)

VT
На сайте с 27.01.2001
Offline
130
#2
Я бы вместе со словом реферат написал интересующую меня тематику, или воспользовался поиском в базе рефератов

Скорее всего имеется в виду не тот реферат - реферат документа (abstract).

А какой-нить поисковик умеет после запроса сформировать отчет с рефератами близких по смыслу документов (при ограничении размера отчета) с выделением наиболее значимых терминов?

Что значит близких по смыслу? Разве при запросе, принадлежащем одной выбранной теме, поисковик не выдает документы по этой и близким темам?

Например, по

Information Retrieval.

А наиболее значимые термины - имеется в виду keyphrases extraction?

F
На сайте с 29.11.2003
Offline
1
#3

По всей видимости произошла путаница в терминологии.

Запрос - тот запрос, который отправляется на поисковик (та строчка, которая отсылается поисковику) по интересующей меня теме.

Документы - это результат работы поисковика, то есть страницы наиболее близкие к запросу.

Реферат - смысловая выжимка документа. В данном случае реферат я понимаю как: при анализе документа, строится семантическая сеть (в узлах которой находятся наиболее значимые термины, а близость к смыслу определяется весом связи между узлами), из которой вытаскиваются те фразы, в которых присутствуют термины с наибольшим весом связи в семантической сети.

Отчет - файл с рефератами нескольких документов.

Термины - наиболее значимые слова или фразы близкие по смыслу к запросу.

Как я понял ни один поисковик не умеет делать то, что мне надо. Значит вопрос переходит в плоскость софта, который это умеет.

Всё что я перечислил можно сделать руками. :) Отослать запрос на поисковик, скачать первые 30-50 документов (страниц), сохранить в виде текста, с помощью TextAnalyst построить сеть, посмотреть наиболее значимые термины, сделать рефераты нужных документов, объединить их в один файл. Вообщем, это занимает кучу времени, поэтому хочется некоторой автоматизации. :) Вот я и спрашиваю, может кто-нибудь знает, какой софт это умеет делать?

PS TextAnalyst, TextRefearer можно посмотреть на www.analyst.ru или на www.megaputer.com

VT
На сайте с 27.01.2001
Offline
130
#4
Вот я и спрашиваю, может кто-нибудь знает, какой софт это умеет делать?

Скорее всего, такую программу вряд ли где-то можно взять бесплатно. А для каких целей это нужно, если не секрет?

F
На сайте с 29.11.2003
Offline
1
#5
Как писал Vyacheslav Tikhonov

Скорее всего, такую программу вряд ли где-то можно взять бесплатно. А для каких целей это нужно, если не секрет?

- Для мониторинга ситуации за определенный период (например социльно-экономического развития регионов центрального федерального округа);

- Для обзоров, какие факторы влияют на деятельность компании (например для темы "мосэнерго" будет куча подтем: земельные отношения, тарифы, аскуэ, реализация интересов на форэм, энергоэффективные технологии, реформирование, сети, непрофильные активы и т.д.). по терминам можно определить наиболее значимые подтемы;

- и быстрое "погружение" в незнакомую тему. :)

VT
На сайте с 27.01.2001
Offline
130
#6

Что ж, все понятно. Мониторинг информации и конкурентная разведка.

Подобные продукты с нужными функциями есть, но стоят денег, и немалых. Free версий лично я не видел.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий