ИИ позволяет автоматизировать обработку документов, упрощая процессы и снижая затраты - Курилка

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

Sly32 · 2024-11-03T11:12:06.0000000Z

Довольно многои темы сваливаются в применение ИИ в тех или иных областях. Предлагаю со всеми этими вопросами приходить сюда. Делимся проблемами, опытом, рассказываем что сделали с помощью ИИ. Различия моделей, как работает и прочие новости в области AI

P

447

plab

8 ноября 2024, 09:13

#171

Sly32 #:
Не согласен. Вот ты специалист по замеру окон, но не видишь, как тут можно упростить работу. Я - IT-architect и я вижу что можно применить. Ты вообще похоже не очень знаешь, как работает все это в современном мире. Вот например ты в курсе, как наша компания получает клиентов?

Я в курсе что вы фантазер:

Sly32 #:

Тебе их в день присылают десятками, многостраничных, на разных языках, в разных форматах, а тебе нужно извлечь только пару параметров. Доки могут приходить в любых параметрах - как текстовый файл, как пдф, как картинка просто..

Кому? Ну например врачу, исследователю. Учителю упростит работу.

Ни врачу, ни исследователю, ни учителю не приходят кучи документов в разных форматах. От кого они должны приходить? Полубредовая ситуация, одна на миллион.

Sly32 #:
Учителю упростит работу. Ты загружаешь например параграф по теме и просишь выбрать основные положения темы и сделать опросник - вот тебе готовый тест для учеников по теме...

Получится дебильный опросник для дебилов. Разработка проверочных работ требует осознанной проработки материала. Надо понимать, по каким моментам надо задавать вопросы, а по каким - глупо. ЖПТ этого не понимает.

Sly32 #:
Пока же предпочтительнее работа по найму. В ней одни плюсы.

Так и работайте по найму. Свое дело - это всегда убыток в начале. Не факт что дело пойдет и будет получать как при работе по найму. Это всегда системный анализ. Это не прочитал справку по ЯП, научился, пошел сделал, тебе дали денег за то что такой умный. Тут алгоритмы принятия решений несколько сложнее. Это журавль в небе.

Помогите разобраться с Joomla Конкурс: дизайн+верстка (цветочный магазин Словодёр эффективный парсер поисковых

S3

391

Sly32

8 ноября 2024, 09:37

#172

plab #:
Ни врачу, ни исследователю, ни учителю не приходят кучи документов в разных форматах.

Ты живешь в своем узком мирке вебмастера и не пытаешься посмотреть шире. А я стараюсь обьяснить это тебе. Вот тебе примеры из моего личного опыта, то над чем я лично работал.

- Проект по обработке архивных документов - данные по геологоразведке. Оказалось, что каждый штат хранит документацию как попало, у всех свой формат. На основе ML наша система могла разобрать самый потрепаный документ и вытянуть из него данные в автоматическом режиме. Это мы делали лет 5-7 назад, еще до всего этого хайпа с АИ.
- Создание контрактов по продаже дилерских и аукционных автомобилей в Америке. Опять же у каждого штата свои форматы документации. Приходилось писать отдельные блоки обработки под каждый штат. Если бы там применить АИ - в раз ы бы было все проще. Впрочем уверен, что счас они к этому уже пришли.

- Это корпоративные примеры. Но есть и из личного. Мой товарищ открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

plab #:
Получится дебильный опросник для дебилов. Разработка проверочных работ требует осознанной проработки материала. Надо понимать, по каким моментам надо задавать вопросы, а по каким - глупо. ЖПТ этого не понимает.

Я мог бы привести тебе массу аргументов, Почему это не так. Сделаем проще, если тебе интересно. Я все равно работаю сейчас над такой системой. Типа дипломная работа. Когда закончу - дам тебе доступ и ты сам посмотришь, на что она способна.

plab #:
Так и работайте по найму.

Я и работаю. Все это - в рамках развития.

Нейросети оставят на рынке Яндекс Каталог, советы и Им для оптовика -

P

447

plab

8 ноября 2024, 11:20

#173

Sly32 #:
- Это корпоративные примеры. Но есть и из личного. Мой товарищ открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

Так у вас товарищ стартап-корпорацию походу открыл. Ведь столько заказов, что отдел клерков держать бы пришлось. Тут городской самый популярный фитнес-центр если с десяток договоров в день заключит, уже кул. Два клерка в отделе продаж сидят и все в ручную.

В любом случае все сходится к тому, что AI никому не даст заработать, кроме владельцев крупного бизнеса. Или спецов в области AI, работающих на крупный бизнес. Все остальные от AI только пострадают.

1/6 часть суши - "Трели" Соловьёва о кошмарении Помогите с выбором хостинга

S3

391

Sly32

8 ноября 2024, 11:39

#174

plab #:
Так у вас товарищ стартап-корпорацию походу открыл.

У нас с вами разные представления о корпорациях) Но несколько миллионов инвестиций в прошлом году они, насколько я знаю, привлекли.

D

35

Devstory

9 ноября 2024, 09:01

#175

Sly32 #:

Ты живешь в своем узком мирке вебмастера и не пытаешься посмотреть шире. А я стараюсь обьяснить это тебе. Вот тебе примеры из моего личного опыта, то над чем я лично работал.

- Проект по обработке архивных документов - данные по геологоразведке. Оказалось, что каждый штат хранит документацию как попало, у всех свой формат. На основе ML наша система могла разобрать самый потрепаный документ и вытянуть из него данные в автоматическом режиме. Это мы делали лет 5-7 назад, еще до всего этого хайпа с АИ.
- Создание контрактов по продаже дилерских и аукционных автомобилей в Америке. Опять же у каждого штата свои форматы документации. Приходилось писать отдельные блоки обработки под каждый штат. Если бы там применить АИ - в раз ы бы было все проще. Впрочем уверен, что счас они к этому уже пришли.

- Это корпоративные примеры. Но есть и из личного. Мой товарищ открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

Я мог бы привести тебе массу аргументов, Почему это не так. Сделаем проще, если тебе интересно. Я все равно работаю сейчас над такой системой. Типа дипломная работа. Когда закончу - дам тебе доступ и ты сам посмотришь, на что она способна.

У нас все это реализовано давно , на базе 1с. Там сейчас столько сервисов напилено , любую тему что ты придумаешь - уже реализовано скорее всего. Особенно все что касается b2b.А так как там все интегрировано с бухгалтерией и всяческими erp, crm , то написание всяких стартапов теряет смысл и поэтому они обречены на провал.

1

Движок для рефератов Бесплатная десктопная CRM Cityads.ru - партнёрская система

S3

391

Sly32

9 ноября 2024, 09:29

#176

Devstory #:
У нас все это реализовано давно , на базе 1с.

Можешь рассказать, как что-то из приведенных мною примеров у вас реализовано на основе 1С? Очень любопытно.

Теперь мои новости)
Поняв, что многие документы имеются в виде картинок, вспомнил, про еще одну возможность нейросетей - распознавание обьектов, в частности текста. Поэтому прикрутил OCR использующую нейросети - Tesseract. Теперь достаточно загрузить фотку документа в систему, дальше она сама преобразует в ПДФ, потом обработает документ, создаст эмбеддинги, закинет все это в векторную базу. Теперь при работе я уже могу задавать вопросы и бот будет использовать не только пре-трэйнед модели, но и дополнения с помощью RAG.
Пока думаю как это все хранить. Прикручивать еще и векторную базу данных типа Pinecone не очень хочется, у меня и так уже есть скалярный Постгрес и графовая Neo4j. склоняюсь postgres c векторным модулем

Нейросети оставят на рынке Новые технологии в поиске Яндекс Лавка реализовала возможность

D

35

Devstory

9 ноября 2024, 09:49

#177

Sly32 #:

Можешь рассказать, как что-то из приведенных мною примеров у вас реализовано на основе 1С? Очень любопытно.

1с распознавание документов. На базе нейросети тоже какой то работает. И создание на основе всего этого и договоров и закупок можно сделать. Зачем отдельный сервис делать ? Никому он не будет нужен.

Есть и распознавание речи и много чего ещё. И все можно получить из коробки за небольшие деньги они, ну если нужно допилить. Поэтому сейчас особо никого ничем не удивить так как все технологии уже есть. 1с встраивает ИИ модули в свои продукты уже более 5 лет.

(free) Инструменты для работы Яндекс работает над аналогом Одноклассники запустили сервис распознавания

S3

391

Sly32

9 ноября 2024, 11:05

#178

Devstory #:
1с распознавание документов.

Это работает только со специфичными документами - накладными, фактурами. Умеет вносить данные по шаблону.

Мой сервис имеет другую направленность совершенно, умеет распознавать любые документы в любых форматах ну и главное - обрабатывать информацию.

Да и опять же, вроде как говорим а возможностях, что можно сделать с использованием ИИ, а не "А, это уже есть..."

И я не говорю про коммерческую направленность.

Буржуйские каталоги Интернет магазин и регионы Сопоставим ли PHP с

P

447

plab

9 ноября 2024, 11:44

#179

Sly32 #:
Поняв, что многие документы имеются в виде картинок, вспомнил, про еще одну возможность нейросетей - распознавание обьектов, в частности текста. Поэтому прикрутил OCR использующую нейросети - Tesseract. Теперь достаточно загрузить фотку документа в систему, дальше она сама преобразует в ПДФ, потом обработает документ, создаст эмбеддинги, закинет все это в векторную базу. Теперь при работе я уже могу задавать вопросы и бот будет использовать не только пре-трэйнед модели, но и дополнения с помощью RAG.
Пока думаю как это все хранить. Прикручивать еще и векторную базу данных типа Pinecone не очень хочется, у меня и так уже есть скалярный Постгрес и графовая Neo4j. склоняюсь postgres c векторным модулем

Помню, в году так 2010-м сканил книжки и пропускал их через прогу распознавания текста. Потом править приходилось. Нейросети ж не было. Буквы могли быть распознаны не так, а поправить программа не могла. В добавок тире, переходы на новые строки создавали проблемы. Править надо было вручную.

Но чтобы все это происходило автоматом, там проработка "ИИ" должна быть весьма детальная. Распознавание опечаток (неправильно распознанных букв) в отдельных словах - это самое простое. Выборка из контекста графики, переносы, абзацы - эта обработка уже сложнее.

Баян - программа теста Есть ли такое ПО, Электронная читалка с большим

S3

391

Sly32

9 ноября 2024, 11:59

#180

plab #:

Помню, в году так 2010-м сканил книжки и пропускал их через прогу распознавания текста. Потом править приходилось. Нейросети ж не было. Буквы могли быть распознаны не так, а поправить программа не могла. В добавок тире, переходы на новые строки создавали проблемы. Править надо было вручную.

Но чтобы все это происходило автоматом, там проработка "ИИ" должна быть весьма детальная. Распознавание опечаток (неправильно распознанных букв) в отдельных словах - это самое простое. Выборка из контекста графики, переносы, абзацы - эта обработка уже сложнее.

В начале 2000-х купил себе крутой сканер, который даже негативы цветные умел сканить в фото и там был FineReader к комплекте. Хорошая штука, но с нынешним Тессарактом не сравнить. Английский распознает почти идеально, даже в местах излома страниц и если тень попала. Вот с белорусским подкачал, не знает букву "Ы" например))) Но возможно, нужно подгружать языковые модули.

Рушим мифы про мерцание Выбираю принтер Тексты губят сайт в

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.