Ну по одному слову естественно ничего не понятно. Тут просто можно придугадывать. А вот если предложение то тут надо проводить анализ. А без анализа никак нельзя делать поисковую систему, она же должна выводить наиболее подходящую информацию. Тоесть "Интеллектуальный анализ запросов" подразумевает анализ запроса с той целью, что бы система поняла, что этому пользователю от нее нужно.
Вот как раз у меня проблема первая - это то что надо анализировать слова. Тоетсь привести их к заглавной форме. Причем этих заглавных форм может оказаться несколько - что с ними делать это уже другой вопрос. (Замок - всмысле строение и всмысле тот, который с ключом).
Пока я пытаюсь сделать лемматизатор, для приведения к заглавной форме, например, делал -> делать. Потом разбирать уже предложение, где тут глагол, где еще что-то. Но проблема пока как раз таки в приведении к заглавной форме.
А вот если от этого отказаться, то я не совсем еще понял как тогда организовать поиск. У меня пока утсроено так:
1)Индексируется документ - тоесть все слова в нем переводятся в заглавную форму и сохраняются в БД. Ту да же еще всякая информация по документу (набор шинглов, адрес и т.д.)
Вот тогда для самого поиска мне все слова надо тоже к заглавной форме привести. Как же мне тут отказаться от анализа?
ну я подумал я ж все таки - новичек) Вот и пошел в раздел для новичков)