plab

Рейтинг
423
Регистрация
26.04.2010

Сейчас позадавал вопросы YaGPT по своим тематикам. Там где "Эта информация сама возникла в чертогах моего нейросетевого разума" - либо пространные ответы, либо бред.

А где по делу, то дает ссылку на сайт источник. Т. е. кто берет контент из ИИ по факту берет либо бред, либо по сути это копипаста с других сайтов. Смешно.

ArbNet #:

Так рассуждают только те, кто не может сам что-то придумать и сделать, поэтому в мыслях у них, что всё уже придумано и уже сделано..

Где я писал, что все придумано? Вы текст понимать не в силах. В лёгкую вы уже опоздали. Так что вкалывайте и придумаете. 

Devstory #:
Есть и распознавание речи  и много чего ещё. И все можно получить из коробки за небольшие деньги они, ну если нужно допилить. Поэтому сейчас особо никого ничем не удивить так как все технологии уже  есть. 1с встраивает ИИ модули в свои продукты уже более 5 лет. 

Потому что все что можно было в легкую автоматизировать, уже сделано. Осталось либо что не автоматизируется, либо требует очень детального разбора/
понимания области/темы, куда хотят приложить ИИ. То есть нужен в первую очередь специалист в теме. А методологии ИИ скорее всего стандартны.

Sly32 #:
Поняв, что многие документы имеются в виде картинок, вспомнил, про еще одну возможность нейросетей - распознавание обьектов, в частности текста. Поэтому прикрутил OCR использующую нейросети - Tesseract. Теперь достаточно загрузить фотку документа в систему, дальше она сама преобразует в ПДФ, потом обработает документ, создаст эмбеддинги, закинет все это в векторную базу. Теперь при работе я уже могу задавать вопросы и бот будет использовать не только пре-трэйнед модели, но и дополнения с помощью RAG. 
Пока думаю как это все хранить. Прикручивать еще и векторную базу данных типа  Pinecone не очень хочется, у меня и так уже есть скалярный Постгрес и графовая Neo4j. склоняюсь postgres c векторным модулем

Помню, в году так 2010-м сканил книжки и пропускал их через прогу распознавания текста. Потом править приходилось. Нейросети ж не было. Буквы могли быть распознаны не так, а поправить программа не могла. В добавок тире, переходы на новые строки создавали проблемы. Править надо было вручную. 

Но чтобы все это происходило автоматом, там проработка "ИИ" должна быть весьма детальная. Распознавание опечаток (неправильно распознанных букв) в отдельных словах - это самое простое. Выборка из контекста графики, переносы, абзацы - эта обработка уже сложнее. 

Sly32 #:
- Это корпоративные примеры. Но есть и из личного. Мой товарищ  открыл стартап в Америке - смарт-закупки. Как только заказчик не присылает свои требование, хорошо, что не голубями. У некоторых даже факсы еще живы)))
И вот все это летит в систему, распознающую это, нет надобности держать огромный отдел клерков, занимающихся вводом документации - все автоматически.

Так у вас товарищ стартап-корпорацию походу открыл. Ведь столько заказов, что отдел клерков держать бы пришлось. Тут городской самый популярный фитнес-центр если с десяток договоров в день заключит, уже кул. Два клерка в отделе продаж сидят и все в ручную. 

В любом случае все сходится к тому, что AI никому не даст заработать, кроме владельцев крупного бизнеса. Или спецов в области AI, работающих на крупный бизнес. Все остальные от AI только пострадают. 

Sly32 #:
Не согласен. Вот ты специалист по замеру окон, но не видишь, как тут можно упростить работу. Я - IT-architect  и я вижу что можно применить. Ты вообще похоже не очень знаешь, как работает все это в современном мире. Вот например ты в курсе, как наша компания получает клиентов?

Я в курсе что вы фантазер:

Sly32 #:

Тебе их в день присылают десятками, многостраничных, на разных языках, в разных форматах, а тебе нужно извлечь только пару параметров. Доки могут приходить в любых параметрах - как текстовый файл, как пдф, как картинка просто..

Кому? Ну например врачу, исследователю. Учителю упростит работу.

Ни врачу, ни исследователю, ни учителю не приходят кучи документов в разных форматах. От кого они должны приходить? Полубредовая ситуация, одна на миллион.

Sly32 #:
Учителю упростит работу. Ты загружаешь например параграф по теме и просишь выбрать основные положения темы и сделать опросник - вот тебе готовый тест для учеников по теме... 

Получится дебильный опросник для дебилов. Разработка проверочных работ требует осознанной проработки материала. Надо понимать, по каким моментам надо задавать вопросы, а по каким - глупо. ЖПТ этого не понимает. 

Sly32 #:
Пока же предпочтительнее  работа по найму. В ней одни плюсы. 

Так и работайте по найму. Свое дело - это всегда убыток в начале. Не факт что дело пойдет и будет получать как при работе по найму. Это всегда системный анализ. Это не прочитал справку по ЯП, научился, пошел сделал, тебе дали денег за то что такой умный. Тут алгоритмы принятия решений несколько сложнее. Это журавль в небе.

Sly32 #:

На фоне этих дискуссий пришла в голову идея набросать простенький сервис, в который отправляется фотография документа, он из него делает пдфку и отвечает на вопросы.

Для чего? На это будет спрос? Кому оно будет надо, кроме как по приколу?

Sly32 #:
Дальше предлагаю говорить о том что умеет, а что нет ИИ.

Заработать можно только на том, в чем разбираетесь или готовы это делать. Можно создать сайт, систематизирующий материалы по ИИ, где, кроме теории, на небольших примерах (типа фото -> пдф + описание) демонстрировать его возможности. Через какое-то время вы будете спецом по ИИ, консультация которого будет чего-то стоить. + заработок на рекламе, если сайт начнет набирать аудиторию. + возможная продажа этих небольших прил с доработкой под заказчика. Люди, которые из предметных сфер, лучше знают, как это можно применить на практике, где это реально надо.

Но здесь есть два вопроса, на которые надо стразу давать утвердительные ответы. Иначе начинать нет смысла.

1. Уверены, что ИИ - это технология, имеющая практический смысл. Она навсегда в IT. ?

2. Сайты делаются и развиваются годами. Это не проекты "сегодня пока спорили я сделал". Готовы ли вы посвятить этому одному все свое время?

Sly32 #:
Я уже перестал понимать, о чем мы спорим...

Заменит или нет ЖПТ человеческих создателей контента и программистов-любителей. 

Sly32 #:
Это НИКОГДА  просто работа программиста и заказчика. Есть посредники с определенными функциями - например проект-менеджер и бизнес-аналитик. 

Когда менеджер и аналитик нужен, переплюнет крупная компания. Это не пет- и не инди-проект. В крупной компании есть четкое разграничение по ролям и задачам. 

Только управляет всем этим кто? Не ИИ же.

Но есть миллион мелких ниш, куда корпорациям суваться нет смысла. Как в примере с замерщиками.

Sly32 #:
"О чем этот документ," или "какие показатели крови"...
И для этого мне не нужны медицинские знания вообще. Например, спросил - уровень лейкоцитов в крови и он нашел и выдал мне. Хотя в документе нет этого слова - есть аббревиатура

Человек может это сделать без программы. Медленнее, но сделать запрос по аббревиатуре можно в поисковике. "О чем этот документ" - вопрос философский. О человеке, крови, медицинский. Полное описание документа - краткое его содержание. Программист не произвел новизны, не сделал открытий, обобщений, выводов, следствий, он лишь делетировал лишние действия для человека, облегчил ему жизнь.

ИИ и программист без предметных знаний не смогут создать код, который генерит осмысленную статью даже уровня Дзена (бытует мнение, что это контентная помойка, а значит на сайтах информация качественнее) : dzen.ru/a/ZytW9dETZUjx5tu6

Всего: 5734