желаний поломать мозги я вижу нету , а зря :(
Нет не самореклама , а попытка привлечь заинтересованных людей.Одна голова хорошо , а две лучше - как говорят мудрые люди.Самому мне енто делать долговато будет.А если два , три человека поборятся за одно
это - то енто будет результат посвыше . И при том если если развить это дело , то машина будет способна к некоторой человеческой логике.
Вот такие вот дела.
Все молчатс?
1-й шаг:
создаем дерево(говорят инфа в дереве ищется очень быстро!:) )
Но ентого нам мало . Нам нужны реальные связи слов.А как енто сделать?
Да очень просто всего лишь два дополнительных указателя (предыдущий , последующий)юКазалось бы проблема с вытяжкой полного текста решена !!!
2-й шаг
Нет не решена :)))) проблемка . Будет побочный страшный эфект.Будет создано много одинаковых слов и связь будет теряться(не знаю как на вашем диалекте енто явление правильно назвать). Будут образовываться
множества и сотен таких слов.А енто серьезный трабл.Что же делать?
Но не надо искать решение проблемы вдалеке оно(решение) рядом.
На просто создать нити, покоторым машина могла ходить (прито четко ходить , а не как попало :) ).Казалось бы выход в использовании дополнительных указателей (а че вполне приемлемо). Но нет перерасход памяти , потеря в быстродействии ..... и тд тп.
Надо нормальные полноценные нити.Енту проблему я думаю решит один из методов матстатистики :) А вот какой именно решит - это секретец (ну как именно естественно тоже ).Но поверьте решит ,аж тырса посыпется :)))
3-й шаг (если второй можно было назвать шагом:))
Великая , однако , наука матстатистика не правдали?
Что нам осталось - собственно класифицировать.В ентом нам поможет тоже ,как не странно один замечательный метод из матстатистики чуть чуть видоизменный по отношению к первому (я надеюсь вы уже узнали первый метод?).
Все господа - чудо создано (если конечно еще добавить листиков 30 теории) :))
Остального не скажу , секрет енто большой !!!!!
Дерзайте !
Удачи