Новые технологии в поиске

spark
На сайте с 24.01.2001
Offline
130
#41
Толковые словари пишут люди для ЛЮДЕЙ же.

Хорошо, если упростить ситуацию. Не толковый словарь всем обо всем, а терминологический стандарт какой-нибудь узкой предметной области. Т.е. составлялся терминологами, большинство указанных вами проблем снято. Например, множественность значений терминам не характерна, логические циклы сняты и т.п.

Существуют ли программы, которые могут представить связи такой системы в графическом виде?

B
На сайте с 02.09.2002
Offline
42
bvd
#42
Как писал spark

Существуют ли программы, которые могут представить связи такой системы в графическом виде?

Программ отображения графов связанных объектов много,

например, в продуктах, посвященных исследованию ПО.

В некоторых случаях - классические задачи.

Как писал spark

Не толковый словарь всем обо всем, а терминологический стандарт какой-нибудь узкой предметной области. Т.е. составлялся терминологами, большинство указанных вами проблем снято. Например, множественность значений терминам не характерна, логические циклы сняты и т.п.

Общее мнение, что чем уже область тем дальше можно продвинуться. Например, call-центры.

Чем шире - тем сложнее. С терминами стоит быть по-аккуратнее -

люди-то себя понимают, но каждый чуть-чуть по-разному.

Недавно видел как два доктора наук обнаружили, что один и тот же термин понимали неодинаково.

Может быть дело в том, что "термин" (в узком смысле - практически понятие), и его смысл не изолирован, но зависит от места в терминологической системе. Поэтому даже если термины лексически совпадают, но находятся в разном окружении - проблемы.

При этом - маленькую терминосистему все могут обозревать целиком, но зависит от задачи, хватит ли мощности системы для выражения цели. Если не хватит - идет подкачка терминов из внешнего мира - и см. выше.

AA
На сайте с 16.04.2001
Offline
70
#43
Как писал bvd
здесь вроде обсуждалось, что это панацея - должно быть ЛУЧШЕ всего остального, причем посредством достаточно простых методов. Это - сомнительно.

Насчет автоклассификации - надеюсь ваша команда послала прогоны в РОМИП?

РОМИП - послали и результат получили, о котором я и написал выше. Для веб-документов, естественно, получше: там база больше. Само собой, никак руками не касались: шаблоны не подчищали и параметры не подкручивали. Статью мы уже отправили, надеюсь на семинаре РОМИПа быть.

Наконец-то в этом году дошли руки, и усилия полностью окупились - я имею в виду не результат, конечно, а хороший тест, который теперь будем использовать для отработки критериев оценки релевантности.

Насчет панацеи.

Здесь-то и трудность - разделить чересчур оптимистичные восторги и трезвые оценки технологий. Иначе можно выплеснуть с водой и ребенка, проецируя на технологию чью-нибудь эйфорию по ее поводу. Ты же тоже немного обобщал, говоря о бесполезности использования в дальнейшей машинной обработке (а, значит, и в автоклассификации).

С уважением, Антонов Александр.
spark
На сайте с 24.01.2001
Offline
130
#44
подкачка терминов из внешнего мира

имел счастие наблюдать это явление на примере экологической терминологии. Но, ИМХО, в таких случаях всегда есть очень хорошие индикаторы того, что термин заимствован из другой системы, и проблемы это не составляет. Авторы так и норовят подчеркнуть что это "экологический мониторинг", а не просто мониторинг, "экорегион" а не просто регион и т.д. При чем делают все это достаточно стереотипно, для выявления таких нововведений в текстах достаточно функций Ворда, надо только выявить наиболее продуктивные компоненты словосочетаний.

Насчет места в терминологической системе согласен. Тот же "хост" в одном случае можно переводить как "узел", в другом нельзя, хотя в английском это был один термин.

Вобщем, для меня "обозрение маленькой системы" достаточно практическая сейчас задача. Хочу писать учебную работу по интернет-терминологии и сейчас прикидываю, с какой стороны к этому подступиться.

VC
На сайте с 25.02.2004
Offline
5
#45
Как писал bvd


да это все давно видели, красиво конечно...

Можно любое множество объектов связать любыми связями.
Можно даже назвать это "семантическая сеть", "семантический анализатор", ИИ ...

Но является ли эта "семантическая сеть" структурой, что СУЩЕСТВЕННО поможет при информационном поиске?

Прежде всего позволит улучшать показатели выдачи ИПС за счет автоматического расширения/модификации запроса?

Когда я говорю "что-то результатов маловато" подразумевается,
что применение на практике, например, ассоциативных сетей не улучшает показатели поиска.

В приведенном примере стрелочка от "вождение" идет к "Серпуховской район" - это, наверное, так надо расширять запрос? :)

Попробую пояснить. Данная семантическая сеть построена на коллекции МК-новости за 97 год. Верхний уровень - документы с наибольшим весом тем, если по теме проваливаться глубже - будут вскрыты связи с меньшим весом тем.

Как это помогает? В данном случае семантическая сеть предназначена для выявления скрытых взаимосвязей между двумя необходимыми тематиками. То бишь, речь идет не о расширении запроса, а о нахождении коллекции документов, связанных с пересечением данных тем.

B
На сайте с 02.09.2002
Offline
42
bvd
#46
Как писал vadim_crow


Попробую пояснить. Данная семантическая сеть построена ...

А нельзя ли пояснить зачем называть ЭТО "семантической сетью" (кроме как в рекламных целях)?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий