Sly32

Рейтинг
389
Регистрация
29.03.2012
Должность
Software engineer
ArbNet #:
Знаю и побольше твоего.
Ты ни в одном ответе этого не доказал. давай уже начнем обзаться конструктивно.
ArbNet #:
Даже если я буду тебе объяснять что и как хочу написать на Rust,

Пойму - Rust  такой же ЯП как и остальные - нет никакой сложности прочитаить код для меня. 
все что ты пишешь - отговорки и непонятно зачем. Ты вместо того чтобы вместе учиться постоянно срываешься на оскорбления и нападки  - зачем? чего ты этим добиваешься. Ты можещ спросить у друших тут как выглядят твои ответы. Для меня - это общение с обиженным на весь мир школьником.  Прекращай
Никто тут не меряется крутостью. Есть знания - делись, указывай на ошибки. А не бросайся словами, а то получается как почтальон печкин с посылкой. Несерьезно для взрослого человека

ArbNet #:
Нет, я же сказал, мне не интересно на готовом фреймворке и Python
ты знаешь вообще как устроен ЛЛМ? ты понимаешь о чем речь? 
Ты понимаешь что все это построено на работе с матрицами? Что ты хочешь переизобрести - можешь конкретно обяснить. Столько страниц, но ты никак не выразишь свою мысль. Ты не хочешь делать свой фремфорк, я понимаю - он уже на годы отстал от существующиз и там проще все выкинуть и начать заново.
Ты сам говорил про модели нейросетей - я предложил тебе вариант. Ты опять в отговорки.
никаких проблем - ты можешь в том же репо создать аналог на Расте и можно будет сравнить производительность. Это даже интересно.  Только не прикрывацся тут идеями про инновации - поверь - нчего гового ты не напишешь. Я  - тоже. А так - хоть натренируемся, что-то новое узнаем. Давай?

Естати у меня все еще идет тренировка модели. Комп нагрелся и гудит - вот что значит реальная нагрузка. Запустил тренинг на метале маковском. Пайтон отожрал 97% GPU! 
inkubus #:
это районный ИИ, по другому не генерит ответы
упал под стол, это лучший  ответ за сегодня. теперь мы знаем как к нему обращаться))) 
ArbNet #:

Не называй свой код фреймворком.

Да, ты прав, это точно также нельзя назвать фреймворком как и то, что делал ты. А правильное позиционирование  будет таким 

Enterprise GPT Training Platform


Обучите GPT-модель на корпоративных данных. 

On-premise. Конфиденциально. Без vendor lock-in.


🎯 Use Cases:

- Корпоративные AI-ассистенты

- Domain-specific модели (medical, legal, code)

- Customer support automation

- Документация и контент


✅ Value:

- Полный контроль над данными

- Compliance (GDPR, HIPAA, SOC2)

- Экономия на API costs (до 80%)

- Customization под домен


🚀 Быстрый старт:

- Production-ready код

- Streamlit UI

- 2 часа до первой модели


Для компаний, которым важна конфиденциальность.

Это если без технических подробоностей и без раздела OCR

ArbNet #:
А потом попроси создать что-то. Справится?

Ты можешь сам попробовать. Натренируй модель да и все.
У меня счас нет по времени капасити для третьей задачи.
Дать доступ?

Mik Foxi #:
ну так это и надо убрать. зачем такая дичь?
Надо не убрать а правильно настроить. кэширование полезная вещь  если уметь пользоваться.  Или плагины для ВП настолько тупы, что не умеют разделять уровни кэширования, невозможно настроить версионифицирование? 
Александр Воробьев #:

Я не против.

Вообще у меня тоже есть мысли про узкоспециализированную модель. Хотел копать в этом плане. Связанное с моим СааС, но там возможно мне даже математический/статистический подход больше подойдет. Но в ТОДо давно висит задача, в которой своя модель вроде как может быть решением.

ну так излагай идею тут - может общими усилиями найдем  хорошее решение. На моем фреймворке кстати и питон особо знать не надо - по факту только установить. А все параметры настраиваются в UI. И без разницы какие данные моделировать, хоть просто таблицу умножения

alaev #:
Сначала вам продают крем для защиты от ультрафиолетовых лучей. Эффективность этого крема примерно ноль
Может попробуй покупать не сомнительного качества  в точке на рынке, а нормальный? Я вот при нырянии(для фридайвинга если не в костюме) использую Nivea.  Без него - сгораю примерно за 15 минут  в Египте - обгорает спина, лодыжки, шея за тем минуты, пока лежишь на воде. вентилируешься перед нырком. даже с 35-кой можно споуойно до получаса тренироваться. потом нужно заново наносить.
Что за страсть писать ахинею.
Давай экперимент - едем в Хургаду. выходим в 12 часов на 40 минут на солнце -  ты без крема. а я - с. Потом на форуме выкладываем фото спины)) Надеюсь денег хватит на поездку тебе? 😂  Может отучишься потом писать бред?
ArbNet #:
Мне конечно не интересно на готовом фреймворке, да ещё и на Python.
Сразу 2 почему. Но давай подробнее. У тебя какая цель - практическая или теоретическая? Ты хочешь создать свою модель, которая будет работать или ты просто хочешь процесс ражи процесса?
Что тебя не устраивает в пайтон, кроме того, что ты его не знаешь?
Я уже приводил примеры нейросети на базовых командах - это реально, но очень затратно по времени. Зачкм мне заново реализовавать механизм сложения матриц?  Это математика, я все равно там ничего нового не придумаю. А время убью.
Вот тебе результат первого этапа обучения- на исходных данных в 37 Килобайт. модел уже весит 200 Мегабайт и она все еще крайне слабая. Я попробовал создать mini - получилось 37Мегабайт но выдает полный бред.
Теперь взял такой формат
Формат данных: text
Общий размер текста: 205,312 символов
Токенизатор: 181 токенов
Dataset: 184,780 токенов
Dataset: 20,532 токенов
✅ Train: 184268 окон, Val: 20020 окон
Модель создана: 19,270,144 параметров
Что скажешь - что изменить посоветовал бы?

вот этап тренировки  после 10 минут

Epoch 1/5:   9%| | 499/5759 [12:14<1:15:44,  1.16it/s, loss=2.5536, ppl=12.85, lr=3.💾 save_checkpoint: подготовка данных...
💾 save_checkpoint: сохранение в checkpoints/python_model_step_500.pt...
✓ save_checkpoint: файл сохранен (220.6 MB)
Epoch 1/5:  10%| | 599/5759 [13:40<1:15:20,  1.14it/s, loss=2.4275, ppl=11.33, lr=3.
То есть еще все очень плохо. Жаль не сохранил ответ старой модели.
Для теста возьму стандартеые вопросы по пайтону и буду их задавать генератору

Есть какие-то советы из того, что ты уже изучил.  от тебя интересует оптимизация обучения и размеров - вроде как именно это тебя не устраивало больще всего.

Размеры я привел, если нужны еще какие-то параметры - спрашивай


Спор с Арбнет иногда приводит к неожиданным результатам. Захотелось на практике попробовать  создать и натренировать свою модель, узко специализированную и понять - есть ли в этом смысл. Недостатки и достоинства мы примерно знаем. Главная идея - делегировать узкие задачи своей модели и не тратить на это токены. 

Дальше можно не читать, кому эта тема неинтересна. И вопрос к владельцам топика - Александру и Алексею - вы не против моих постов тут на эту тему? По факту это тоже челлендж. Неохота плодить темы и тут уже есть контекст, полезный для понимания разговора. Тема про ИИ слишком широкая, к тому же загажена изрядно флудерами.

Суть идеи - создать свою LLM, которая сможет работать на ограниченных ресурсах с приемлемым результатом. 

Я не претендую на оригинальность. Поэтому просто взял существующий фреймворк для создания модели. Написал для него удобный UI,  используя Streamlit. Язык разработки - Python. Ч

Возможности:
- Настройка типа и размера модели. То есть не нужно копаться в коде - все вынесено на страницу управления - размер, контеуст, слои, эпохи...

- Возможность как тренировки модели с нуля, так и дообучения на любом этапе.

- Подготовка датасета: можно парсить данные с отсканированных документов, пока что есть поддержка jpg/jpeg/png,  Можно выбирать бесплатный вариант - Tessaract или более крутой - GPT-4 Vision, но он потребует ваш апи ключ. Если знаете варианты - говорить, добавлю

- Обучение идет в фоне. то есть сам фреймворк  не будет тратить ресурсы
- можно выбирать режимы обучения - на обычном процессоре или на GPU

- Встренный режим работы с млделью - можно сразу попробовать пообщаться с ней. Храняться генерации модели - можно дообучать с любого уровня

Если найдутся желающие попробовать - опубликую репозиторий, берите пользуйтесь. Бесплатно.

Для себя выбрал  сейчас 2  каталога - Общая химия(школьная программа)  и  Python. C первой приходится долго возиться-  нужно аккуратно разгребать сканы, править формулы, с пайтоном проще. Но обучать модел можно чему угодно - это обычный трансформер.

И сразу первые результаты и понимание - нужно много данных. 
Интересно?

Вопрос - кто нибудь пробовал  работать с  GPT-4 Vision. для распознавания отсканированных документов? Все таки Тессаракт требует постобработки. Вопрос к тем, кто пользовался исключительно!
Всего: 8131