Поиск по нескольким словам

12
AA
На сайте с 16.04.2001
Offline
70
#11
Как писал spark
Это по подшивке газет поиск был, или по большей базе?
... Хотя вряд ли пригодится, потому как я украинские тексты обрабатываю.
Кстати, интересно, как зум работает. Это с семантическими расстояниями как-то связано?

База - подшивка газет в 7 млн. статей. Конечно, на демо-сервере база существенно урезана.

Была бы украинская база, был бы и украинский список слов-словосочетаний, но увы.

Что до работы Зума, то расстояния между терминами не применяются, работает система "короля играет свита" - статанализ контекста. Существенно, что при оценивании весов терминов применяется принцип относительности, иначе не избежать проекции верхушки словаря по закону Зипфа-Мандельброта. Подробнее на эту тему я рассказывал в топике Морфология, ключевые понятия и семантические связи текста. Опять же есть статьи на демо-сайте Зум.

С уважением, Антонов Александр.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий