Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

P
На сайте с 26.04.2010
Offline
417
#171
Sly32 #:
Не согласен. Вот ты специалист по замеру окон, но не видишь, как тут можно упростить работу. Я - IT-architect  и я вижу что можно применить. Ты вообще похоже не очень знаешь, как работает все это в современном мире. Вот например ты в курсе, как наша компания получает клиентов?

Я в курсе что вы фантазер:

Sly32 #:

Тебе их в день присылают десятками, многостраничных, на разных языках, в разных форматах, а тебе нужно извлечь только пару параметров. Доки могут приходить в любых параметрах - как текстовый файл, как пдф, как картинка просто..

Кому? Ну например врачу, исследователю. Учителю упростит работу.

Ни врачу, ни исследователю, ни учителю не приходят кучи документов в разных форматах. От кого они должны приходить? Полубредовая ситуация, одна на миллион.

Sly32 #:
Учителю упростит работу. Ты загружаешь например параграф по теме и просишь выбрать основные положения темы и сделать опросник - вот тебе готовый тест для учеников по теме... 

Получится дебильный опросник для дебилов. Разработка проверочных работ требует осознанной проработки материала. Надо понимать, по каким моментам надо задавать вопросы, а по каким - глупо. ЖПТ этого не понимает. 

Sly32 #:
Пока же предпочтительнее  работа по найму. В ней одни плюсы. 

Так и работайте по найму. Свое дело - это всегда убыток в начале. Не факт что дело пойдет и будет получать как при работе по найму. Это всегда системный анализ. Это не прочитал справку по ЯП, научился, пошел сделал, тебе дали денег за то что такой умный. Тут алгоритмы принятия решений несколько сложнее. Это журавль в небе.

S3
На сайте с 29.03.2012
Offline
366
#172
plab #:
Ни врачу, ни исследователю, ни учителю не приходят кучи документов в разных форматах.

Ты живешь в своем узком мирке вебмастера и не пытаешься посмотреть шире. А я стараюсь обьяснить это тебе. Вот тебе примеры из моего личного опыта, то над чем я лично работал.

- Проект по обработке архивных документов - данные по геологоразведке. Оказалось, что каждый штат хранит документацию как попало, у всех свой формат. На основе ML наша система могла разобрать самый потрепаный документ и вытянуть из него данные в автоматическом режиме. Это мы делали лет 5-7 назад, еще до всего этого хайпа с АИ.
- Создание контрактов по продаже дилерских и аукционных автомобилей в Америке. Опять же у каждого штата свои форматы документации. Приходилось писать отдельные блоки обработки под каждый штат. Если бы там применить АИ - в раз ы бы было все проще. Впрочем уверен, что счас они к этому уже пришли.

- Это корпоративные примеры. Но есть и из личного. Мой товарищ  открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

plab #:
Получится дебильный опросник для дебилов. Разработка проверочных работ требует осознанной проработки материала. Надо понимать, по каким моментам надо задавать вопросы, а по каким - глупо. ЖПТ этого не понимает. 

Я мог бы привести тебе массу  аргументов, Почему это не так. Сделаем проще, если тебе интересно. Я все равно работаю сейчас над такой системой. Типа дипломная работа. Когда закончу - дам тебе доступ и ты сам посмотришь, на что она способна.

plab #:
Так и работайте по найму.

Я и работаю. Все это - в рамках развития.

P
На сайте с 26.04.2010
Offline
417
#173
Sly32 #:
- Это корпоративные примеры. Но есть и из личного. Мой товарищ  открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

Так у вас товарищ стартап-корпорацию походу открыл. Ведь столько заказов, что отдел клерков держать бы пришлось. Тут городской самый популярный фитнес-центр если с десяток договоров в день заключит, уже кул. Два клерка в отделе продаж сидят и все в ручную. 

В любом случае все сходится к тому, что AI никому не даст заработать, кроме владельцев крупного бизнеса. Или спецов в области AI, работающих на крупный бизнес. Все остальные от AI только пострадают. 

S3
На сайте с 29.03.2012
Offline
366
#174
plab #:
Так у вас товарищ стартап-корпорацию походу открыл.

У нас с вами разные представления о корпорациях) Но несколько миллионов инвестиций в прошлом году они, насколько я знаю, привлекли.

D
На сайте с 06.01.2022
Offline
31
#175
Sly32 #:

Ты живешь в своем узком мирке вебмастера и не пытаешься посмотреть шире. А я стараюсь обьяснить это тебе. Вот тебе примеры из моего личного опыта, то над чем я лично работал.

- Проект по обработке архивных документов - данные по геологоразведке. Оказалось, что каждый штат хранит документацию как попало, у всех свой формат. На основе ML наша система могла разобрать самый потрепаный документ и вытянуть из него данные в автоматическом режиме. Это мы делали лет 5-7 назад, еще до всего этого хайпа с АИ.
- Создание контрактов по продаже дилерских и аукционных автомобилей в Америке. Опять же у каждого штата свои форматы документации. Приходилось писать отдельные блоки обработки под каждый штат. Если бы там применить АИ - в раз ы бы было все проще. Впрочем уверен, что счас они к этому уже пришли.

- Это корпоративные примеры. Но есть и из личного. Мой товарищ  открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

Я мог бы привести тебе массу  аргументов, Почему это не так. Сделаем проще, если тебе интересно. Я все равно работаю сейчас над такой системой. Типа дипломная работа. Когда закончу - дам тебе доступ и ты сам посмотришь, на что она способна.


У нас все это реализовано давно , на базе 1с. Там сейчас столько сервисов напилено , любую тему что ты придумаешь - уже реализовано скорее всего. Особенно все что касается b2b.А так как там все интегрировано с бухгалтерией и всяческими erp, crm , то написание всяких стартапов теряет смысл и поэтому они обречены на провал. 

S3
На сайте с 29.03.2012
Offline
366
#176
Devstory #:
У нас все это реализовано давно , на базе 1с.

Можешь рассказать, как что-то из приведенных мною примеров у вас реализовано на основе 1С? Очень любопытно.

Теперь мои новости)
Поняв, что многие документы имеются в виде картинок, вспомнил, про еще одну возможность нейросетей - распознавание обьектов, в частности текста. Поэтому прикрутил OCR использующую нейросети - Tesseract. Теперь достаточно загрузить фотку документа в систему, дальше она сама преобразует в ПДФ, потом обработает документ, создаст эмбеддинги, закинет все это в векторную базу. Теперь при работе я уже могу задавать вопросы и бот будет использовать не только пре-трэйнед модели, но и дополнения с помощью RAG. 
Пока думаю как это все хранить. Прикручивать еще и векторную базу данных типа  Pinecone не очень хочется, у меня и так уже есть скалярный Постгрес и графовая Neo4j. склоняюсь postgres c векторным модулем

D
На сайте с 06.01.2022
Offline
31
#177
Sly32 #:

Можешь рассказать, как что-то из приведенных мною примеров у вас реализовано на основе 1С? Очень любопытно.


1с распознавание документов. На базе нейросети тоже какой то работает. И создание на основе всего этого и договоров и закупок можно сделать. Зачем отдельный сервис делать ? Никому он не будет нужен. 

Есть и распознавание речи  и много чего ещё. И все можно получить из коробки за небольшие деньги они, ну если нужно допилить. Поэтому сейчас особо никого ничем не удивить так как все технологии уже  есть. 1с встраивает ИИ модули в свои продукты уже более 5 лет. 

S3
На сайте с 29.03.2012
Offline
366
#178
Devstory #:
1с распознавание документов.

Это работает только со специфичными документами - накладными, фактурами. Умеет вносить данные по шаблону.

Мой сервис имеет другую направленность совершенно, умеет распознавать любые документы в любых форматах ну и главное - обрабатывать информацию.

Да и опять же, вроде как говорим а возможностях, что можно сделать с использованием ИИ, а не  "А, это уже есть..."

И я не говорю про коммерческую направленность. 

P
На сайте с 26.04.2010
Offline
417
#179
Sly32 #:
Поняв, что многие документы имеются в виде картинок, вспомнил, про еще одну возможность нейросетей - распознавание обьектов, в частности текста. Поэтому прикрутил OCR использующую нейросети - Tesseract. Теперь достаточно загрузить фотку документа в систему, дальше она сама преобразует в ПДФ, потом обработает документ, создаст эмбеддинги, закинет все это в векторную базу. Теперь при работе я уже могу задавать вопросы и бот будет использовать не только пре-трэйнед модели, но и дополнения с помощью RAG. 
Пока думаю как это все хранить. Прикручивать еще и векторную базу данных типа  Pinecone не очень хочется, у меня и так уже есть скалярный Постгрес и графовая Neo4j. склоняюсь postgres c векторным модулем

Помню, в году так 2010-м сканил книжки и пропускал их через прогу распознавания текста. Потом править приходилось. Нейросети ж не было. Буквы могли быть распознаны не так, а поправить программа не могла. В добавок тире, переходы на новые строки создавали проблемы. Править надо было вручную. 

Но чтобы все это происходило автоматом, там проработка "ИИ" должна быть весьма детальная. Распознавание опечаток (неправильно распознанных букв) в отдельных словах - это самое простое. Выборка из контекста графики, переносы, абзацы - эта обработка уже сложнее. 

S3
На сайте с 29.03.2012
Offline
366
#180
plab #:

Помню, в году так 2010-м сканил книжки и пропускал их через прогу распознавания текста. Потом править приходилось. Нейросети ж не было. Буквы могли быть распознаны не так, а поправить программа не могла. В добавок тире, переходы на новые строки создавали проблемы. Править надо было вручную. 

Но чтобы все это происходило автоматом, там проработка "ИИ" должна быть весьма детальная. Распознавание опечаток (неправильно распознанных букв) в отдельных словах - это самое простое. Выборка из контекста графики, переносы, абзацы - эта обработка уже сложнее. 

В начале 2000-х купил себе крутой сканер, который даже негативы цветные умел сканить в фото и там был FineReader к комплекте. Хорошая штука, но с нынешним Тессарактом не сравнить. Английский распознает почти идеально, даже в местах излома страниц и если тень попала. Вот с белорусским подкачал, не знает букву "Ы" например))) Но возможно, нужно подгружать языковые модули. 

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий