AiK
А вы не задумывались как вы понимаете все вокруг?
Пытаясь научить машину думать как думает "человек" на голых примерах это бред !!!! Без окружающих вы и я и все были бы "0" - нет информации. Машине можно это предоставить в неограниченом количестве(информацию).
Не надо лезть в глубь , поймите простое человеческое!!!!!
У нас есть фраза:
"Идет он по улице мимо вывески Intel"
Получаем:
1-е , 2-е слово и 3-е слово: получуем фигуру "3" .
Связи(поймите наконец то) :
"Ид" , "о" и "ули" отбросятся ,но приобретут силу кода повысится степепь полинома (а может быть ?).Отобразим этот закон в полиноме(не понадобиться выбросим). Строим связи (в сравнении с поступившей информацией); вот он симплекс.
В начале имеем линию потом треугольник потом 3-х гранную пирамиду и тд. Так вот вам и смысл.Похожи фигуры - оно ; не похожи не оно
, частично совпадают - схоже.
Но это еще далеко не все !!!
С уважением
"msa"
Толи я неправильно рассказывал тут об алгоритме , толи вы отказываетесь понимать о чем идет речь.
В скором времени увидите первые шаги в "бинарном" варианте...
Всем спасибо за дискусию по данной теме.
:))
Интересно что бы ответил человек на такой вопрос? :)
По этому запросу машина выдаст информацию которая прямо относится к Intel ,а не коственно.Не будет кучи мусора.
Итак - запрос "Intel XXX точно", предполагается что информация по данной теме принята и отфильтрована .К этому моменту уравнение регресии для поискового симплекса (не фильтра!!)
продвинулось от начальной линейной формы.Запрос подставляется в это уравнение и машина начинает передвигаться "осмысленно" по дереву.
euhenio
Какой запрос?
Разложите все по "полкам" и я вам скажу принцип ответа.
AlexA
Я уже незнаю как вам лучше обьяснить данную тему(разве что живое общение). Ваш последний пример машина пройдет без труда.Одинаковый
вход промежуток разный и далее ,я думаю, речь пойдет о томже .Так в чем же дело.
/*выбери логикой значение словосочетания "тёмный замок" - премию получишь
И вообще я что-то никак понять не могу что ты собираешься классифицировать?
Если взять дохленький словарь на 10К слов, и построить даже не сочетания, а хотя бы перестановки из 4-х слов, то получится 416416712 миллионов словосочетаний. Проверять не устанешь? */
"И все не то и все не так"
Вы не поняли ,какие перестановки? В даном алгоритме они будут постоко поскоку.Гланое не все комбинации слов , а их первоначальный смысл (текст ,который изначально поступает на обработку). Насчет "тёмный замок" машина найдет сотни применений данного словосочетания, наткнувшись один раз на более менее внятное обьяснение.
Так та не так.
В вашем примере входы и выходы разные , а середина одинакова .Машина
их различит без труда.Но ваш пример запроса безсмысленный даже для человека, а машина будет обладать примерно логикой "маленького" человека.В общем случае из вашего запроса мы получим одно "темное" слово в пересечении тем.
"И, пожалуйста, подробнее про "темные" места в графе."
Еще раз о темных местах :
темным щитается слово которое 1 и более раз попадается во многих источниках инФорации .Этих слов будет довольно таки много. Постоянное динамическое выделение памяти , при встрече данного слова, под указатель на каждое последующее и предыдущее слово не даст нам желаемого результата.
Теперь другая ситуация:
У нас в дереве бутут слова , которые практически нигде не встречаются
(очень очень мало).Эти слова будут указывать на "темные" слова(тянуть нить).
Далее надо прикрутить к этому дереву симплекс (он нужен токо для ходьбы по темным местам дерева , я чуть выше рассказывал о каком именно виде симплекса идет речь).
Сама по себе это получается безполезная система.
Что бы она работала нужна "шляпа" - умный фильтр.
Этим фильтром ,по моим соображением будет, один из симплексных планов
(центроидный или D - оптимальный ).
"Давайте для начала разберем простейший пример, как ваша система получит морфологию (хотя бы, просто сведет лексему) слова "идти".
"
Как известно , любое слово можно представить в виде числа(прямое пребразование, хеш-функцией - это не столь важно).
В графе получаемые слова(по порядку) можно представить в виде некоторой фигуры .После фильтрации это будет уже не замкнутая фигура
а какая то ломаная линия с узлами , имеющая вход выход и промежуточную
реализацию.Берем похожую фразу " к примеру самый простой случай:: 1-я фраза(рассказ о каком то человеке и мемуар етого человека) ::"одинаково" шел он "одинаково":: 2-я фраза ::"одинаково" иду я "одинаково":: " проделываем с ней тоже самое и налаживаем дуг на друга. Имеем одинаковый вход и выход , а промежуток разный.Попутно будут определяться весовые коэфициенты(нужны для морфолоии ошибок синтаксиса и тд. , а также для разбиения на "сгустки" слов). При этом дописываем уравнение регресии ,верней ,делаем его более универсальным длы перемещения симплекса и поиска по дереву. Как обновлять уравнение я покамесь не буду рассказывать.
Получается своеобразная нейросеть.
Вот как раз я уверен , что это абсолютно новое и аналога ему нету.
Вот почему я говорю, что надо научить ходить машину(и лучше симплекса вы не найдете в решении данной проблемы), а потом просто улучшать ее шаги ("Умный учится на ошибках других -дурак на своих").Простое передвижение по дереву не даст такого результата (реальный пример - все поисковики интернета) , которые даст самосовершенствующийся симплекс (дописать самого себя, сам путь - уравнение регресии, которое постоянно совершенствуется).
Я вижу , что особого интереса к этой проблеме у жителей данного форума нет. Причина -толи мой "неудачный " дебют на данном форуме, толи еще что-то.
Всем спасибо за поддержание данной темы.
" msa "
Синонимы тоже будут работать в "одной упряжке".Но вводить их машине не надо будет отдельно "типа привязок к словарю" .Она сама найдет эти зависимости и будет двигаться по ним. По моим предположениям:
запрос - "идти по улице " машина вытянет не токо строгое соответствие,
но и ,к примеру , "передвигаться по улицам" .