Кто то на западе доказал что для некоторых естественных языков можно совсем обойтись без словоформ. Среди них был и английский. А вот для нашего любимого, великого и могучего... как же тут без словоформ.
Я как статью эту найду, так сразу ссылочку кину.
На самом деле я делаю этот поиск для своего диплома. Серьезных познаний у меня нет, вот думал какие-то моменты может получиться обсудить в этом разделе форума. Тонкости реализации меня конечно интересуют, но что называть тонкостями. Математическая модель - вроде и не такая интеллектуальная собственность. Хотя тоже как посмотреть.
А литературы - завались, это точно. Но все равно возникают вопросы... и хотелось бы живого обсуждения...
Мне кажется на этом форуме не хватает конкретных примеров. Чтоб с нуля... Вот если доделаю, обязательно выложу свою работу :)
Не. Еще не удалили... Или не все... По-моему это дело нескольких дней.
А представьте, какой сейчас в Яндексе аврал...
Все бегают....суетяться... начальники ругаются... администраторы потеют :)
Жуть...
С морфологией разобрались. Морфологический анализ - есть хорошо. У меня были сомнения насчет того, стоит ли его делать. Решил, что, все-таки стоит...
Дальше встает самый, на мой взгляд, интересный вопрос - о математической модели... Какую выбрать? Я думаю, что стоит остановиться на алгебраических моделях и рассчитывать вес для каждого слова в тексте описания. Тогда, нужно будет создавать индекс для каждого описания. А нормально ли будет ли работать такая модель?
:D :D :D
А беда-то в чем? Какая беда?
Индексатор все равно придет и переиндексирует...
А что бы было?
Там написано M-подсветка, а H-зеркальщик, хотя по идее должно быть M (Mirror) - зеркальщик и H (Highlight) - подсветка.
Может в faq ошиблись?
Суть такая, что вторые два сайта (см. выше в моем предыдущем сообщении) долбил ссылками пока позиции не перестали расти. Это было с месяц назад. Выше они не росли, поэтому я и перестал накачивать их ссылками. А сегодня, вдруг, влезли и в десятки и в пятерки!
Ссылки рулят, господа!