Маленький скромненький поиск...

F
На сайте с 24.02.2005
Offline
13
1323

Здравствуйте!

Прошу совета и помощи... Задача следующая...

Есть каталог сайтов, с их описаниями (до 1000 символов - все равно больше никто не хочет писать нормальное описание сайта)

с двухуровневой структурой. Необходимо сделать поиск в этом каталоге. Не просто поиск первых двадцати вхождений в базу слов из запроса, а "осмысленный" поиск, может быть даже с морфологическим разбором запроса, математической моделью, ранжированием результатов и т.д. Вообще, стоит ли делать тот же морфологический разбор запроса? Какую модель выбрать? Нужна ли она вообще? Посоветуйте, пожалуйста... Может быть Вы сталкивались с такой задачей или с литературой на тему поиска подобном каталоге.

Заранее благодарен,

Иван.

lagif
На сайте с 15.12.2004
Offline
30
#1

freeman,

Насчет морфологического разбора - думаю, его надо делать однозначно. Чтоб искать слово во всех формах.

Ранжирование - понятие сложное... главное, определитесь, по каким факторам ранжировать и создавайте для каждого сайта индекс ранжирования (впрочем, скорее всего его придется формировать на лету уже при поиске...)

Литературы много. Гугл рулит. Только приготовьтесь к тому, что почти вся она будет на английском.

Это тоже пройдет...
F
На сайте с 24.02.2005
Offline
13
#2

С морфологией разобрались. Морфологический анализ - есть хорошо. У меня были сомнения насчет того, стоит ли его делать. Решил, что, все-таки стоит...

Дальше встает самый, на мой взгляд, интересный вопрос - о математической модели... Какую выбрать? Я думаю, что стоит остановиться на алгебраических моделях и рассчитывать вес для каждого слова в тексте описания. Тогда, нужно будет создавать индекс для каждого описания. А нормально ли будет ли работать такая модель?

lagif
На сайте с 15.12.2004
Offline
30
#3

freeman, :) Если нормально сделате - нормально и работать будет... :)

F
На сайте с 24.02.2005
Offline
13
#4

Мне кажется на этом форуме не хватает конкретных примеров. Чтоб с нуля... Вот если доделаю, обязательно выложу свою работу :)

lagif
На сайте с 15.12.2004
Offline
30
#5

freeman,

Обычно "для себя" ничего серьезного никто не пишет. А если не для себя - ваш труд уже интеллектуальная собственность фирмы, и рассказывать тонкости реализации никто забесплатно тебе не станет.

А примеров и советов хватает на любом языке.

F
На сайте с 24.02.2005
Offline
13
#6

На самом деле я делаю этот поиск для своего диплома. Серьезных познаний у меня нет, вот думал какие-то моменты может получиться обсудить в этом разделе форума. Тонкости реализации меня конечно интересуют, но что называть тонкостями. Математическая модель - вроде и не такая интеллектуальная собственность. Хотя тоже как посмотреть.

А литературы - завались, это точно. Но все равно возникают вопросы... и хотелось бы живого обсуждения...

lagif
На сайте с 15.12.2004
Offline
30
#7

freeman,

Смотрите на citforum'е, читайте статьи...

Я тоже делала на эту тему диплом. :) Создание диплома и создание реально работающего поисковика - почти разные вещи.

Кроме того, что за полгода (или сколько Вам на диплом отпущено?) создать хороший поисковик крайне трудно. Теории много, а практика - от нее отличается. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий