Вспоминается книжка Попова "Общение с ЭВМ на естественом языке" 80 г.
А существуют ли какие-нибудь работающие модели семантического поиска?
(Не в целях рекламы) Мммм а как на счет вероятностного стэммера А. Коваленко?
Очень многообещающий топик - но, на мой взгляд, не высказано ни одной ЦЕЛИ, которую необходимо достичь в системе НОВОГО ПОКОЛЕНИЯ: только желание достичь уровня существующих поисковиков.
Может все-таки open source - должен иметь место?
Где можно купить? Те, что я встречал стоят не одну тысячу долларов - для студента деньги большие, да и проект у меняя изначально бесплатный.
Большое спасибо за ссылки.
Явные орфографические ошибки безусловно надо чистить - даже в Лингво встречаются таковые.
Что считать ошибкой? - еще не знаю, пока сделал лишь разделение - на существующие и потенциально возможные формы.
Подскажите а где взять выверенные корпуса? Может такие есть?
Ммм...Немного затрудняюсь ответить, я не знаю, что такое - качество кодирования? Речь идет о развороте словаря.
Зачем нужно? Проверить правильно ли программно отработаны пометы описания парадигмы словаря А.А.Зализняка.
2AlexA
Ммм... словарь Зализняка позволяет получить не только существующие формы, но и потенциальные, к примеру ср.ст."абрикосовее", мн.ч."автомобилестроения" и т.п. Считать ли такие формы - "правильными"? Думаю - да.
Более того "выверенные" корпуса текстов не дают грамматической, а уж тем более и фонетической информации.
Может быть сравним словари на предмет ошибок?