Ken

Рейтинг
31
Регистрация
22.04.2003

Вспоминается книжка Попова "Общение с ЭВМ на естественом языке" 80 г.

А существуют ли какие-нибудь работающие модели семантического поиска?

(Не в целях рекламы) Мммм а как на счет вероятностного стэммера А. Коваленко?

Очень многообещающий топик - но, на мой взгляд, не высказано ни одной ЦЕЛИ, которую необходимо достичь в системе НОВОГО ПОКОЛЕНИЯ: только желание достичь уровня существующих поисковиков.

Может все-таки open source - должен иметь место?

Где можно купить? Те, что я встречал стоят не одну тысячу долларов - для студента деньги большие, да и проект у меняя изначально бесплатный.

Большое спасибо за ссылки.

Явные орфографические ошибки безусловно надо чистить - даже в Лингво встречаются таковые.

Что считать ошибкой? - еще не знаю, пока сделал лишь разделение - на существующие и потенциально возможные формы.

Подскажите а где взять выверенные корпуса? Может такие есть?

Ммм...Немного затрудняюсь ответить, я не знаю, что такое - качество кодирования? Речь идет о развороте словаря.

Зачем нужно? Проверить правильно ли программно отработаны пометы описания парадигмы словаря А.А.Зализняка.

2AlexA

Ммм... словарь Зализняка позволяет получить не только существующие формы, но и потенциальные, к примеру ср.ст."абрикосовее", мн.ч."автомобилестроения" и т.п. Считать ли такие формы - "правильными"? Думаю - да.

Более того "выверенные" корпуса текстов не дают грамматической, а уж тем более и фонетической информации.

Может быть сравним словари на предмет ошибок?

Всего: 49