Sly32

Рейтинг
389
Регистрация
29.03.2012
Должность
Software engineer
Artisan #:
«Марш энтузиастов» из
кинофильма «Светлый путь».
Может уже таблетки какие попей? булет проще держаться в контексте темы? Топик перепутал
ArbNet #:

Я ранее уже говорил, что хочу на Rust написать свои ЯП, с модулями: базы данных, веб-сервер, нейросетью и др. для микросервисной системы.

Да причем тут то что ты хочешь? Мв говорми о конкретных вещах - фреймворках. нейросетях, а не о твоих планах. Ты приходишь с неконструктивной критикой но когда тебе задаешь конкретные вопросы - ты в кусты и начинаешь чем то там прикрываться. Какая тебе разница на старте - пойму ли я или нет - ты сначал озвучь
"Вот я изучил нейросети - вот этот момент при создании неправильный - я знаю как его улучшить - надо сделать так и так..."  Это будет нормальная беседа. А не твои выдумки. Ты вот не смог понять чем отличается оллама от нейросети, начал писать о ее недостатках вместо того чтоб говорить о деле, пока тебе не сказали - ты даже не знал про ollama.cpp. Это не стыдно - не знать что-то, как ты не понимаешь. 
учеба это в первую очередь призанание факта что ты что-то не понимаешь. 
ArbNet #:

Фреймворк - это инструмент облегчающий и ускоряющий работу, в нём нет полностью готовых рабочих проектов.

А CMS - это уже готовый проект(блог, магазин и тд.) который при необходимости можно менять, что-то добавлять, удалять уже готовые компоненты. Ну и контентом наполнить.

ЗЫ. Мне ли тебе объяснять..

Видишь - ты даже не можешь сформулировать правильно что такое ФФ и CMS!
CMS - это не готовый проект! Это тоже инструмент для создания блога, магазина  итд. В отличие от фреймворка  он уже содержит какие-то готовые модули, упрошающие  создание. Например админскую часть. Но в нем есть вшитые ограничения. Например Вордпресс успользует уже структурированную базу данных, которую не очень удобно расширять - там это костыли в виде метаданных.  на основе готовых таблиц
Фреймворк же тебе дает свободу использовать базу как угодно, просто представляет(или нет) какую-то ОРМ. А ты пытаешься зашить создание таблиц в ХТМЛ.
Точно так же ларавел тебя не ограничивает в выюоре фронтенда - он отделен. А ты впился в свой XML. 
Разделяй темы о которых мы говорим и не мешай все до кучи
Сьехали на нейросети - так и будь в теме без туманных намеков.

ArbNet #:
Знаю и побольше твоего.
Ты ни в одном ответе этого не доказал. давай уже начнем обзаться конструктивно.
ArbNet #:
Даже если я буду тебе объяснять что и как хочу написать на Rust,

Пойму - Rust  такой же ЯП как и остальные - нет никакой сложности прочитаить код для меня. 
все что ты пишешь - отговорки и непонятно зачем. Ты вместо того чтобы вместе учиться постоянно срываешься на оскорбления и нападки  - зачем? чего ты этим добиваешься. Ты можещ спросить у друших тут как выглядят твои ответы. Для меня - это общение с обиженным на весь мир школьником.  Прекращай
Никто тут не меряется крутостью. Есть знания - делись, указывай на ошибки. А не бросайся словами, а то получается как почтальон печкин с посылкой. Несерьезно для взрослого человека

ArbNet #:
Нет, я же сказал, мне не интересно на готовом фреймворке и Python
ты знаешь вообще как устроен ЛЛМ? ты понимаешь о чем речь? 
Ты понимаешь что все это построено на работе с матрицами? Что ты хочешь переизобрести - можешь конкретно обяснить. Столько страниц, но ты никак не выразишь свою мысль. Ты не хочешь делать свой фремфорк, я понимаю - он уже на годы отстал от существующиз и там проще все выкинуть и начать заново.
Ты сам говорил про модели нейросетей - я предложил тебе вариант. Ты опять в отговорки.
никаких проблем - ты можешь в том же репо создать аналог на Расте и можно будет сравнить производительность. Это даже интересно.  Только не прикрывацся тут идеями про инновации - поверь - нчего гового ты не напишешь. Я  - тоже. А так - хоть натренируемся, что-то новое узнаем. Давай?

Естати у меня все еще идет тренировка модели. Комп нагрелся и гудит - вот что значит реальная нагрузка. Запустил тренинг на метале маковском. Пайтон отожрал 97% GPU! 
inkubus #:
это районный ИИ, по другому не генерит ответы
упал под стол, это лучший  ответ за сегодня. теперь мы знаем как к нему обращаться))) 
ArbNet #:

Не называй свой код фреймворком.

Да, ты прав, это точно также нельзя назвать фреймворком как и то, что делал ты. А правильное позиционирование  будет таким 

Enterprise GPT Training Platform


Обучите GPT-модель на корпоративных данных. 

On-premise. Конфиденциально. Без vendor lock-in.


🎯 Use Cases:

- Корпоративные AI-ассистенты

- Domain-specific модели (medical, legal, code)

- Customer support automation

- Документация и контент


✅ Value:

- Полный контроль над данными

- Compliance (GDPR, HIPAA, SOC2)

- Экономия на API costs (до 80%)

- Customization под домен


🚀 Быстрый старт:

- Production-ready код

- Streamlit UI

- 2 часа до первой модели


Для компаний, которым важна конфиденциальность.

Это если без технических подробоностей и без раздела OCR

ArbNet #:
А потом попроси создать что-то. Справится?

Ты можешь сам попробовать. Натренируй модель да и все.
У меня счас нет по времени капасити для третьей задачи.
Дать доступ?

Mik Foxi #:
ну так это и надо убрать. зачем такая дичь?
Надо не убрать а правильно настроить. кэширование полезная вещь  если уметь пользоваться.  Или плагины для ВП настолько тупы, что не умеют разделять уровни кэширования, невозможно настроить версионифицирование? 
Александр Воробьев #:

Я не против.

Вообще у меня тоже есть мысли про узкоспециализированную модель. Хотел копать в этом плане. Связанное с моим СааС, но там возможно мне даже математический/статистический подход больше подойдет. Но в ТОДо давно висит задача, в которой своя модель вроде как может быть решением.

ну так излагай идею тут - может общими усилиями найдем  хорошее решение. На моем фреймворке кстати и питон особо знать не надо - по факту только установить. А все параметры настраиваются в UI. И без разницы какие данные моделировать, хоть просто таблицу умножения

alaev #:
Сначала вам продают крем для защиты от ультрафиолетовых лучей. Эффективность этого крема примерно ноль
Может попробуй покупать не сомнительного качества  в точке на рынке, а нормальный? Я вот при нырянии(для фридайвинга если не в костюме) использую Nivea.  Без него - сгораю примерно за 15 минут  в Египте - обгорает спина, лодыжки, шея за тем минуты, пока лежишь на воде. вентилируешься перед нырком. даже с 35-кой можно споуойно до получаса тренироваться. потом нужно заново наносить.
Что за страсть писать ахинею.
Давай экперимент - едем в Хургаду. выходим в 12 часов на 40 минут на солнце -  ты без крема. а я - с. Потом на форуме выкладываем фото спины)) Надеюсь денег хватит на поездку тебе? 😂  Может отучишься потом писать бред?
ArbNet #:
Мне конечно не интересно на готовом фреймворке, да ещё и на Python.
Сразу 2 почему. Но давай подробнее. У тебя какая цель - практическая или теоретическая? Ты хочешь создать свою модель, которая будет работать или ты просто хочешь процесс ражи процесса?
Что тебя не устраивает в пайтон, кроме того, что ты его не знаешь?
Я уже приводил примеры нейросети на базовых командах - это реально, но очень затратно по времени. Зачкм мне заново реализовавать механизм сложения матриц?  Это математика, я все равно там ничего нового не придумаю. А время убью.
Вот тебе результат первого этапа обучения- на исходных данных в 37 Килобайт. модел уже весит 200 Мегабайт и она все еще крайне слабая. Я попробовал создать mini - получилось 37Мегабайт но выдает полный бред.
Теперь взял такой формат
Формат данных: text
Общий размер текста: 205,312 символов
Токенизатор: 181 токенов
Dataset: 184,780 токенов
Dataset: 20,532 токенов
✅ Train: 184268 окон, Val: 20020 окон
Модель создана: 19,270,144 параметров
Что скажешь - что изменить посоветовал бы?

вот этап тренировки  после 10 минут

Epoch 1/5:   9%| | 499/5759 [12:14<1:15:44,  1.16it/s, loss=2.5536, ppl=12.85, lr=3.💾 save_checkpoint: подготовка данных...
💾 save_checkpoint: сохранение в checkpoints/python_model_step_500.pt...
✓ save_checkpoint: файл сохранен (220.6 MB)
Epoch 1/5:  10%| | 599/5759 [13:40<1:15:20,  1.14it/s, loss=2.4275, ppl=11.33, lr=3.
То есть еще все очень плохо. Жаль не сохранил ответ старой модели.
Для теста возьму стандартеые вопросы по пайтону и буду их задавать генератору

Есть какие-то советы из того, что ты уже изучил.  от тебя интересует оптимизация обучения и размеров - вроде как именно это тебя не устраивало больще всего.

Размеры я привел, если нужны еще какие-то параметры - спрашивай


Всего: 8123