msa

Рейтинг
2
Регистрация
02.10.2002
Должность
C/C++ for Linux,Win

AiK

А вы не задумывались как вы понимаете все вокруг?

Пытаясь научить машину думать как думает "человек" на голых примерах это бред !!!! Без окружающих вы и я и все были бы "0" - нет информации. Машине можно это предоставить в неограниченом количестве(информацию).

Не надо лезть в глубь , поймите простое человеческое!!!!!

У нас есть фраза:

"Идет он по улице мимо вывески Intel"

Получаем:

1-е , 2-е слово и 3-е слово: получуем фигуру "3" .

Связи(поймите наконец то) :

"Ид" , "о" и "ули" отбросятся ,но приобретут силу кода повысится степепь полинома (а может быть ?).Отобразим этот закон в полиноме(не понадобиться выбросим). Строим связи (в сравнении с поступившей информацией); вот он симплекс.

В начале имеем линию потом треугольник потом 3-х гранную пирамиду и тд. Так вот вам и смысл.Похожи фигуры - оно ; не похожи не оно

, частично совпадают - схоже.

Но это еще далеко не все !!!

С уважением

"msa"

Толи я неправильно рассказывал тут об алгоритме , толи вы отказываетесь понимать о чем идет речь.

В скором времени увидите первые шаги в "бинарном" варианте...

Всем спасибо за дискусию по данной теме.

С уважением

"msa"

:))

Интересно что бы ответил человек на такой вопрос? :)

По этому запросу машина выдаст информацию которая прямо относится к Intel ,а не коственно.Не будет кучи мусора.

Итак - запрос "Intel XXX точно", предполагается что информация по данной теме принята и отфильтрована .К этому моменту уравнение регресии для поискового симплекса (не фильтра!!)

продвинулось от начальной линейной формы.Запрос подставляется в это уравнение и машина начинает передвигаться "осмысленно" по дереву.

euhenio

Какой запрос?

Разложите все по "полкам" и я вам скажу принцип ответа.

AlexA

Я уже незнаю как вам лучше обьяснить данную тему(разве что живое общение). Ваш последний пример машина пройдет без труда.Одинаковый

вход промежуток разный и далее ,я думаю, речь пойдет о томже .Так в чем же дело.

/*выбери логикой значение словосочетания "тёмный замок" - премию получишь

И вообще я что-то никак понять не могу что ты собираешься классифицировать?

Если взять дохленький словарь на 10К слов, и построить даже не сочетания, а хотя бы перестановки из 4-х слов, то получится 416416712 миллионов словосочетаний. Проверять не устанешь? */

"И все не то и все не так"

Вы не поняли ,какие перестановки? В даном алгоритме они будут постоко поскоку.Гланое не все комбинации слов , а их первоначальный смысл (текст ,который изначально поступает на обработку). Насчет "тёмный замок" машина найдет сотни применений данного словосочетания, наткнувшись один раз на более менее внятное обьяснение.

С уважением

"msa"

Так та не так.

В вашем примере входы и выходы разные , а середина одинакова .Машина

их различит без труда.Но ваш пример запроса безсмысленный даже для человека, а машина будет обладать примерно логикой "маленького" человека.В общем случае из вашего запроса мы получим одно "темное" слово в пересечении тем.

С уважением

"msa"

"И, пожалуйста, подробнее про "темные" места в графе."

Еще раз о темных местах :

темным щитается слово которое 1 и более раз попадается во многих источниках инФорации .Этих слов будет довольно таки много. Постоянное динамическое выделение памяти , при встрече данного слова, под указатель на каждое последующее и предыдущее слово не даст нам желаемого результата.

Теперь другая ситуация:

У нас в дереве бутут слова , которые практически нигде не встречаются

(очень очень мало).Эти слова будут указывать на "темные" слова(тянуть нить).

Далее надо прикрутить к этому дереву симплекс (он нужен токо для ходьбы по темным местам дерева , я чуть выше рассказывал о каком именно виде симплекса идет речь).

Сама по себе это получается безполезная система.

Что бы она работала нужна "шляпа" - умный фильтр.

Этим фильтром ,по моим соображением будет, один из симплексных планов

(центроидный или D - оптимальный ).

"Давайте для начала разберем простейший пример, как ваша система получит морфологию (хотя бы, просто сведет лексему) слова "идти".

"

Как известно , любое слово можно представить в виде числа(прямое пребразование, хеш-функцией - это не столь важно).

В графе получаемые слова(по порядку) можно представить в виде некоторой фигуры .После фильтрации это будет уже не замкнутая фигура

а какая то ломаная линия с узлами , имеющая вход выход и промежуточную

реализацию.Берем похожую фразу " к примеру самый простой случай:: 1-я фраза(рассказ о каком то человеке и мемуар етого человека) ::"одинаково" шел он "одинаково":: 2-я фраза ::"одинаково" иду я "одинаково":: " проделываем с ней тоже самое и налаживаем дуг на друга. Имеем одинаковый вход и выход , а промежуток разный.Попутно будут определяться весовые коэфициенты(нужны для морфолоии ошибок синтаксиса и тд. , а также для разбиения на "сгустки" слов). При этом дописываем уравнение регресии ,верней ,делаем его более универсальным длы перемещения симплекса и поиска по дереву. Как обновлять уравнение я покамесь не буду рассказывать.

Получается своеобразная нейросеть.

Дело в том, что предлагаемое НЕ НОВО.

Литература по классификации и смежным вопросам огромна.
Наиболее близко по теме: ассоциативные тезаурусы, коллокации,
матрицы смежности, корреляции, LSA и т.д. и т.п.

Есть продукты, см. например, NeuroK.

Проблема в том, что вся статистика и др. механистичные процедуры
неплохо формируют, максимум, верхнюю часть списка "ссылок".
Но все быстро рассыпается с уменьшением частотности и НИКТО
еще не сделал иного. По-моему, так и не сделает, из-за фундаментальной неполноты текстов.

Вот как раз я уверен , что это абсолютно новое и аналога ему нету.

Вот почему я говорю, что надо научить ходить машину(и лучше симплекса вы не найдете в решении данной проблемы), а потом просто улучшать ее шаги ("Умный учится на ошибках других -дурак на своих").Простое передвижение по дереву не даст такого результата (реальный пример - все поисковики интернета) , которые даст самосовершенствующийся симплекс (дописать самого себя, сам путь - уравнение регресии, которое постоянно совершенствуется).

Я вижу , что особого интереса к этой проблеме у жителей данного форума нет. Причина -толи мой "неудачный " дебют на данном форуме, толи еще что-то.

Всем спасибо за поддержание данной темы.

С уважением

" msa "

Синонимы тоже будут работать в "одной упряжке".Но вводить их машине не надо будет отдельно "типа привязок к словарю" .Она сама найдет эти зависимости и будет двигаться по ним. По моим предположениям:

запрос - "идти по улице " машина вытянет не токо строгое соответствие,

но и ,к примеру , "передвигаться по улицам" .

123 4
Всего: 33