Пойму - Rust такой же ЯП как и остальные - нет никакой сложности прочитаить код для меня. все что ты пишешь - отговорки и непонятно зачем. Ты вместо того чтобы вместе учиться постоянно срываешься на оскорбления и нападки - зачем? чего ты этим добиваешься. Ты можещ спросить у друших тут как выглядят твои ответы. Для меня - это общение с обиженным на весь мир школьником. ПрекращайНикто тут не меряется крутостью. Есть знания - делись, указывай на ошибки. А не бросайся словами, а то получается как почтальон печкин с посылкой. Несерьезно для взрослого человека
Не называй свой код фреймворком.
Да, ты прав, это точно также нельзя назвать фреймворком как и то, что делал ты. А правильное позиционирование будет таким
Enterprise GPT Training Platform
Обучите GPT-модель на корпоративных данных.
On-premise. Конфиденциально. Без vendor lock-in.
🎯 Use Cases:
- Корпоративные AI-ассистенты
- Domain-specific модели (medical, legal, code)
- Customer support automation
- Документация и контент
✅ Value:
- Полный контроль над данными
- Compliance (GDPR, HIPAA, SOC2)
- Экономия на API costs (до 80%)
- Customization под домен
🚀 Быстрый старт:
- Production-ready код
- Streamlit UI
- 2 часа до первой модели
Для компаний, которым важна конфиденциальность.
Это если без технических подробоностей и без раздела OCR
Ты можешь сам попробовать. Натренируй модель да и все.У меня счас нет по времени капасити для третьей задачи.Дать доступ?
Я не против.
Вообще у меня тоже есть мысли про узкоспециализированную модель. Хотел копать в этом плане. Связанное с моим СааС, но там возможно мне даже математический/статистический подход больше подойдет. Но в ТОДо давно висит задача, в которой своя модель вроде как может быть решением.
ну так излагай идею тут - может общими усилиями найдем хорошее решение. На моем фреймворке кстати и питон особо знать не надо - по факту только установить. А все параметры настраиваются в UI. И без разницы какие данные моделировать, хоть просто таблицу умножения
Epoch 1/5: 9%| | 499/5759 [12:14<1:15:44, 1.16it/s, loss=2.5536, ppl=12.85, lr=3.💾 save_checkpoint: подготовка данных...💾 save_checkpoint: сохранение в checkpoints/python_model_step_500.pt...✓ save_checkpoint: файл сохранен (220.6 MB)Epoch 1/5: 10%| | 599/5759 [13:40<1:15:20, 1.14it/s, loss=2.4275, ppl=11.33, lr=3.
Спор с Арбнет иногда приводит к неожиданным результатам. Захотелось на практике попробовать создать и натренировать свою модель, узко специализированную и понять - есть ли в этом смысл. Недостатки и достоинства мы примерно знаем. Главная идея - делегировать узкие задачи своей модели и не тратить на это токены.
Дальше можно не читать, кому эта тема неинтересна. И вопрос к владельцам топика - Александру и Алексею - вы не против моих постов тут на эту тему? По факту это тоже челлендж. Неохота плодить темы и тут уже есть контекст, полезный для понимания разговора. Тема про ИИ слишком широкая, к тому же загажена изрядно флудерами.Суть идеи - создать свою LLM, которая сможет работать на ограниченных ресурсах с приемлемым результатом.
Я не претендую на оригинальность. Поэтому просто взял существующий фреймворк для создания модели. Написал для него удобный UI, используя Streamlit. Язык разработки - Python. Ч
Возможности:- Настройка типа и размера модели. То есть не нужно копаться в коде - все вынесено на страницу управления - размер, контеуст, слои, эпохи...
- Возможность как тренировки модели с нуля, так и дообучения на любом этапе.
- Подготовка датасета: можно парсить данные с отсканированных документов, пока что есть поддержка jpg/jpeg/png, Можно выбирать бесплатный вариант - Tessaract или более крутой - GPT-4 Vision, но он потребует ваш апи ключ. Если знаете варианты - говорить, добавлю
- Обучение идет в фоне. то есть сам фреймворк не будет тратить ресурсы- можно выбирать режимы обучения - на обычном процессоре или на GPU
- Встренный режим работы с млделью - можно сразу попробовать пообщаться с ней. Храняться генерации модели - можно дообучать с любого уровня
Если найдутся желающие попробовать - опубликую репозиторий, берите пользуйтесь. Бесплатно.Для себя выбрал сейчас 2 каталога - Общая химия(школьная программа) и Python. C первой приходится долго возиться- нужно аккуратно разгребать сканы, править формулы, с пайтоном проще. Но обучать модел можно чему угодно - это обычный трансформер.И сразу первые результаты и понимание - нужно много данных. Интересно?