Разница в кластеризации "по смыслу" - это и есть задача семантики и борьбы с шумом. Проблема в том, что ЛЛМ не сделает и близко. Как и ИИ. Именно поэтому семантику и прорабатывают в первую очередь те, кто нацелен на долгосрочный результат. ) Настройки у КК в семантике почти такие же, как в КА. Тут, скорее, вопрос в автоматизации сторонних запросов, но это работа уже со своим ПО. Имею ввиду давать не только жёсткое ядро, но и отдавать сопутствующие запросы под формирование семантического охвата документа. Т.е. есть основной кластер, а к нему повторяющиеся запросы из других, о СЕРПу.
У КА доразделение неплохо работает, но если ты руками не можешь ставить якорные запросы, то в обоих инструментах получается мусор. )
Странно, что тема мимо меня пролетела. )
AI с кластеризацией не справляется. Но это не важно. В таблицах это всё тоже геморойно. Самое простое - выгружать выгрузку в КК, там конечно оформлять группы, а затем экспортировать в таблицы. Но если семантика не на заказ, то лучше в КК и работать с ней, включая съём позиций.
есть кое какие данные , так сказать со старых времен доступы остались