Ищу партнера для реализации и применения новой технологии

12
DD
На сайте с 07.04.2009
Offline
13
1652

Хочу рассказать о разработанной нами технологии. Около 5 лет я занимался теоретическими разработками искусственного интеллекта. В конце 2008 года мы приступили к реализации разработанного. В марте 2009 получили подтверждение жизнеспособности основных идей заложенных в механизм хранения информации. Ниже по тексту приведены ссылки для скачивания демо-версии - простого поисковика по текстовым документам, там же в архиве будет дано краткое описание технологии, философии и концепции заложенной в этот механизм.

Отмечу, что представленный проект, скорее всего, не имеет ничего общего ни с одной существующей поисковой технологией (немного близко по принципу к wolframalfa). В описании упоминается нейронная сеть, но называть это нейронной сетью будет не совсем верно, т.к. слишком много отличий от известных нейронных сетей. Мы не найдя лучшей аналогии называем ее так.

Теперь главное, чего такого особенного мы сделали.

1. Поиск идет не по ключевым словам, а по смысло - содержащим предложениям и фразам.

2. Чем больше обучаешь сеть, тем выше качество поиска. При этом обучая сеть текстами по физике, улучшаешь качество поиска среди текстов по медицине.

3. У нас нет никаких словарей синонимов, нам не нужно приводить все буквы в тексте к нижнему регистру, и в конечном счете сети все равно на каком языке ее обучать. Мы не отметаем предлоги, все делает свой вклад в результат.

4. Программа устойчива к ошибкам, перестановкам букв, т.е. если к примеру написать слово «перевернулся» как «пеервенурлся», то программа его поймет вероятнее всего именно как «перевернулся» или словоформы этого глагола в зависимости от контекста.

5. Программа не создает индекс текстов, а создает базу понятий, образов и знаний. Т.е. хранящаяся информация о прочитанном никак не разделяется, а напротив дополняет другую.

6. Наверное, еще можно много написать, но не в этом цель.

7. Если загрузить в программу кучу медицинской литературы и энциклопедий по болезням, то можно очень хорошо ставить диагнозы по описанию болезни, кто может покажите медикам, они будут в восторге (а может и нет -

О насущном. Мы физически не в состоянии справиться и развить все направления. К счастью поиск это лишь самое примитивное применение нашей разработки, причем далеко не самое лучшее, т.к. можно в относительно короткие сроки сделать систему дающую ответы на вопросы.

Уже сделаны теоретические наработки и частично практические по следующим направлениям:

1. Перевод с языка на язык. Мы сделаем качеством перевода любой существующий переводчик и скорее всего человека. Для обучения нужны всего лишь словарь и много текстов.

2. Сравнение смысла текстов. Это можете проверить уже сейчас на существующей программе, но для этого ей нужно будет скормить много текстов на разные тематики.

3. Распознавание речи и изображений.

4. Предсказание будущего, как бы странно это не звучало, но это факт от которого никуда не деться. Модель хранения данных и концепция позволяют это делать.

5. Генерация смысловых текстов на любые темы, основываясь на информации загруженную в сеть. Т.е. программа может объединить несколько текстов по смыслу и на их основе выдать что-то новое

Мы приглашаем к сотрудничеству всех заинтересованных людей. И готовы рассмотреть любые интересные предложения по сотрудничеству. Вопросы касающиеся каких-либо аспектов работы системы можно задавать в этой теме, я по возможности готов на них ответить, разумеется всю подноготную выкладывать не собираюсь, поэтому задавая вопросы не забывайте про скромность :-)

ДЕМКА

http://vrtp.ru/std/nnutils.zip

НА сегодняшний день программа не понимает файлов и каталогов с русскими названиями! Поэтому, если будете подсовывать свои файлы (только текстовики, можно на англ.), то используйте латинские буквы.

1. Разместите папку с программой желательно в корневом каталоге.

2. запустите программу.

3. Откройте папку с файлами или отдельный файл.

4. Можно добавлять к уже загруженным данным новые папки и файлы.

5. На данный момент нет индикатора процесса загрузки, просто подождите 2-5 минут, не жмите зря на кнопки.

6. Желательно чтобы на компе было не менее 1 гБ ОЗУ и проц не ниже 1,5 ГГц

7. Поиск ответа занимает от 1 до 10 секунд, поэтому не нужно много раз жать на кнопку поиска.

Если вы получаете в итоге близкие результаты во многих текстах, то вы сформулировали запрос неверно, измените его или уточните.

Если в нескольких текстах получаете близкие запросы, а остальные идут с отрывом, то нужно просто уточнить запрос. Как делать запросы обязательно прочитайте в сопроводительной документации.

В данной версии анализ по синонимам не работает, но другой анализ частично компесирует этот недостаток.

В ближайшее время выпустим улучшеную версию, для тестов, включающую и в том числе анализ синонимов и предсказание следствий.

Поэтому кого смущает спартанский вид - не скачивайте и не комментируйте.

Просьба отписаться по существу, как тестили, что искали, какой вопрос задавали, что получили, довольны ли результатом.

Всем заранее спасибо.

Evgen Orel
На сайте с 20.11.2007
Offline
188
#1

только вчера наткнулся случайно на одном сайте на эту прогу, скачал, затестил, ни чего не получил, выключил, забыл :)

2-5 минут - это жестко, я за это время любой ответ в гугле найду

Быстрая индексация страниц вашего сайта 2index: https://2index.ninja/?from=5864
DD
На сайте с 07.04.2009
Offline
13
#2
c-master:
только вчера наткнулся случайно на одном сайте на эту прогу, скачал, затестил, ни чего не получил, выключил, забыл :)

2-5 минут - это жестко, я за это время любой ответ в гугле найду

Дык нужно ее обучить же было.... если спросить ребенка о чем-то, то он тоже ничего не скажет.

jcrush
На сайте с 04.07.2004
Offline
371
#3

Что к чему?

» Блог (http://blog.stfw.ru/) - SEO-заметки. ДВчат: @dvchat (https://t.me/dvchat)
redbadcat
На сайте с 02.10.2008
Offline
10
#4

Очень интересна тема. Сам занимаюсь нейронными сетями, но немного в другой области.

Хотелось бы узнать какую нейронную сеть вы используете в качестве базовой модели?

Также интересно производится ли анализ текста перед обучением, или задача решается 'в лоб', т е ИНС юзается как статистический классификатор?

DD
На сайте с 07.04.2009
Offline
13
#5
redbadcat:
Очень интересна тема. Сам занимаюсь нейронными сетями, но немного в другой области.
Хотелось бы узнать какую нейронную сеть вы используете в качестве базовой модели?
Также интересно производится ли анализ текста перед обучением, или задача решается 'в лоб', т е ИНС юзается как статистический классификатор?

В качестве базовой модели мы не используем ни одну из общеизвестных нейронных сетей. Текст никак не анализируется перед обучением (есть лишь небольшое ноу хау). Мы напрямую загоняем его в сеть и получаем набор образов в многомерном пространстве (с большой натяжкой можно так назвать) Из каждого образа может быть сделано восстановление букв, слов, даже предложений или связок из нескольких предложений.

redbadcat
На сайте с 02.10.2008
Offline
10
#6

Запрос:"как выбирать"

C:\nnutils\any_txt\ANOMAL.txt 63.19

C:\nnutils\any_txt\instrukziya.txt 58.78

C:\nnutils\any_txt\starost_rodom_iz_detstva.txt 58.73

C:\nnutils\any_txt\LIVE_V.txt 57.07

C:\nnutils\any_txt\COLDLOVE.txt 56.85

C:\nnutils\any_txt\EAT.txt 56.39

C:\nnutils\any_txt\BOOK.txt 56.31

C:\nnutils\any_txt\BATTERY.txt 55.27

C:\nnutils\any_txt\GEOGRAPH.txt 42.85

C:\nnutils\any_txt\pogovorim.txt 37.44

Полное включение оказалось только в одном файле с текстом - LIVE_V.txt

Исходя из чего выбирается количество слоев и нейронов в вашей сети, такое ощущение что она переобучилась....

redbadcat добавил 15.06.2009 в 16:10

dr_dax:
В качестве базовой модели мы не используем ни одну из общеизвестных нейронных сетей. Текст никак не анализируется перед обучением (есть лишь небольшое ноу хау). Мы напрямую загоняем его в сеть и получаем набор образов в многомерном пространстве (с большой натяжкой можно так назвать) Из каждого образа может быть сделано восстановление букв, слов, даже предложений или связок из нескольких предложений.

Что-то сродни самоорганизующимся картам как понимаю?

DD
На сайте с 07.04.2009
Offline
13
#7

С прогой идут файлы с пояснениями как и чего. Поскольку хелпов нашей стране читать не принято, поясню, тк. всеравно будут спрашивать.

Поиск идет не совсем по ключевым словам. Важен смысл вопрошаемой фразы (при хорошем обучении сети). Т.е. идеально если вы просто опишите то, что вы ищите, как если бы встретили человека с улицы.

Напротив каждого текста в выводе идет его рейтинг. Эта версия уже старая (3 месяца ей), мы щас намного дальше продвинулись. Но смысл таков, что циферки напротив файла показывают схожесть по смыслу текстов в контексте заданного запроса. т.е. в вашем случае

C:\nnutils\any_txt\ANOMAL.txt 63.19

C:\nnutils\any_txt\instrukziya.txt 58.78

C:\nnutils\any_txt\starost_rodom_iz_detstva.txt 58.73

C:\nnutils\any_txt\LIVE_V.txt 57.07

C:\nnutils\any_txt\COLDLOVE.txt 56.85

C:\nnutils\any_txt\EAT.txt 56.39

C:\nnutils\any_txt\BOOK.txt 56.31

C:\nnutils\any_txt\BATTERY.txt 55.27

это еще и похожие тексты по смыслу

Количество слоев и нейронов программа выбирает сама (ноу с хау, это не совсем нейронная сеть в классическом понимании), при задании вопроса эта версия не переобучается. Но если дочитать текстов, то доучится и рейтинги поменяются.

Про самоорганизующиеся карты незнаю, я в этом не шарю. Откровенно говоря, я почитал про нейронные сети в общем, поискал частности и похожести на нашу. Не нашел. Но назвали нейронной сетью, потому, что так вроде по смыслу нужно это назвать было.

redbadcat
На сайте с 02.10.2008
Offline
10
#8
dr_dax:
С прогой идут файлы с пояснениями как и чего. Поскольку хелпов нашей стране читать не принято, поясню, тк. всеравно будут спрашивать.
Поиск идет не совсем по ключевым словам. Важен смысл вопрошаемой фразы (при хорошем обучении сети). Т.е. идеально если вы просто опишите то, что вы ищите, как если бы встретили человека с улицы.

Напротив каждого текста в выводе идет его рейтинг. Эта версия уже старая (3 месяца ей), мы щас намного дальше продвинулись. Но смысл таков, что циферки напротив файла показывают схожесть по смыслу текстов в контексте заданного запроса. т.е. в вашем случае
C:\nnutils\any_txt\ANOMAL.txt 63.19
C:\nnutils\any_txt\instrukziya.txt 58.78
C:\nnutils\any_txt\starost_rodom_iz_detstva.txt 58.73
C:\nnutils\any_txt\LIVE_V.txt 57.07
C:\nnutils\any_txt\COLDLOVE.txt 56.85
C:\nnutils\any_txt\EAT.txt 56.39
C:\nnutils\any_txt\BOOK.txt 56.31
C:\nnutils\any_txt\BATTERY.txt 55.27

это еще и похожие тексты по смыслу

Количество слоев и нейронов программа выбирает сама (ноу с хау, это не совсем нейронная сеть в классическом понимании), при задании вопроса эта версия не переобучается. Но если дочитать текстов, то доучится и рейтинги поменяются.
Про самоорганизующиеся карты незнаю, я в этом не шарю. Откровенно говоря, я почитал про нейронные сети в общем, поискал частности и похожести на нашу. Не нашел. Но назвали нейронной сетью, потому, что так вроде по смыслу нужно это назвать было.

В хелпах кроме популистских высказываний совкового периода и о том какое это ноу-хау информации кот наплакал.

За то что ткнули меня носом в хелпы и снизошли до разъяснения - спасибо. Это показывает уровень воспитания. Уровень образования тоже ясен, особенно ярко выражен в последнем абзаце. Вы не представляете что есть нейронные сети и, в так называемых хелпах, пишете про применение в задачах искусственного интеллекта.😂😂😂

Насчет похожести по смыслу - бред, перечитайте тексты и вам самому станет ясно что вы ошибаетесь.

На этом остановлюсь. Успехов в обучении и развитии идеи.

DD
На сайте с 07.04.2009
Offline
13
#9

1. вопрос - сколько текстов загонялось в сеть, для получения вышенаписанных рейтингов.

2. Если текстов было пара-тройка сотен, то программа, опирается только на них. Если у вас выбор действий из: почесаться, покушать, почистить зубы, то что вы выберите, когда вас попросят почесать зубы?

Эта версия только ищет и все! Больше ничего она не умеет!

Вы же видите, что там никаких словарей синонимов, а сама прога весит 150 кбайт (остальное интерфейс). Все на что может опираться система, эта на инфу которую ей скормят. Больше кормите- лучше.

По-поводу идей: все они основаны не на ровном месте, т.к. была проведена очень серьезная исследовательская работа и есть данные позволяющие эти предположения делать. Да, я не разбираюсь в существующих нейронных сетях, да мне это и не нужно. Насколько мне известно, существующие нейронные сети очень ограничены в своих возможностях и работают в узких частных применениях. Ими занимаются десятки лет- результаты лишь частные и очень ограниченные в рамках одной задачи применения. Мы построили свою сеть за чуть более полугода и технически она обладает всеми достоинствами сужествующих нейронных сетей. Не считаю себя каким-то особенно одаренным, но стоит задуматься какое из направлений более верное то, которым занимаются с 60-х годов и где кроме тонн писанины нет почти ничего стоящего или то, что сделано за полгода и уже работает лучше?

uimodeller
На сайте с 13.06.2009
Offline
13
#10
dr_dax:
7. Если загрузить в программу кучу медицинской литературы и энциклопедий по болезням, то можно очень хорошо ставить диагнозы по описанию болезни, кто может покажите медикам, они будут в восторге (а может и нет -

Everybody lies! 🤣D:D

По сабжу. Новая технология, даже если она полурабочая, это по-умолчанию полезно. Все новое полезно, если не в практическом применении, то в научном плане. Касаемо упомянутых в сабже "партнерства" и "применения", я Вас огорчу.

Партнерство — это объединение сил и средств для выгоды партнеров. Это бизнес. Где в этом тексте хоть полунамек на то, как на этом зарабатывать? :) Инвесторам нужны не идеи, нужны продуманые бизнес-модели, от бизнесменов, а не новаторов-рационализаторов.

Ещё год, два года назад, перспективный продукт подобного порядка мог претендовать на внимание и инвестиции. Сейчас в процессе кризис, деньги в бездонный унитаз уже не сливают, риски минимизируют и в авантюры не бросаются. Плюс к этому сама специфика продукта. Каким бы он нибыл инновационным, уникальным, обладающим уникальными качествами, поднять поисковую машину — это многомиллионные инвестиции, конкурентная борьба с гигантами, оборачивающими миллиарды. Это само по себе долгоиграющий проект, с по-умолчанию высокими рисками.

В итоге, сейчас Вам потребуется не просто работоспособная бизнес-модель, а НИВРОТКОСМИЧЕСКИОФИГЕННАЯ(держал шифт) бизнес-модель для такого же безупречного продукта, приносящия деньги даже из распечатки своего бизнес-плана. Потряс листочками — выпала денежка, посмотрел на обложку, словил галлюцинации о миллиарде USD мелкими купюрами, и все твои. У Вас есть это? Судя по увиденному, нет. Потому забейте. Новый поисковик отменяется.

Касаемо применения указанной технологии и востребованых технологий вообще... Раз Вы смогли справиться с почти_нейросетью, обратите свое внимание не на поиск, а на knowledge management, классификацию, каталогизацию, хранение и управление объемами данных. Это востребовано и будет востребовано до тех пор, пока жив WWW. Плюс совершенно случайно можно открыть какие-то фичи, представляющие большую ценность для SEO, для людей, а значит и для Вас самого. Ибо PR4 с перелинковки — далеко не предел, траст ми, вопрос только в цене механизмов на PR5+ :)

Инвалид на полставки.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий