Я практически никогда не пишу о темах, которые мне далеки - ты мог бы это заметить уже. Даже по форуму - я вообще не захожу в темы, которые вне сферы моих интересов. Да, я постоянно гуглю перед ответом, сверяюсь с ИИ. Но это для того, чтобы изложить свою мысль понятнее и точнее. Могу забыть какое то слово, термин. Что толку выкладывать кашу из головы. А так я даю тебе понятный и структурированный ответ, более того - сам перезапоминаю информацию эту. Но я не стану писать про то, что для меня темный лес. Я начал излагать факты по строению нейросетей только после того как полез, вспомнил элементраную математику, что в них используется и как. Чтобы не выдать такие перлы как ты про матрицы. Мне было бы стыдно такое писать.
Ну, аргументируй на примерах, я не против увидеть свои пробелы.
Почему же ты не смог этого сделать на примере моего сервиса, я дал тебе ссылку. Давай, как программист - оцени что именно плохо там, не общими словами.
Что бы делать лучше - нужно сначала узнать как уже сделано. Очень рекомендую
то есть у тебя есть другой алгоритм?
И мамба решает проблему attention а не весов.на сегодня есть несколько альтернатив но ни одна не реализована по многим причинам.Назови хоть одну - которую ты готов решить?
Итак, итоги моего дня. В результате работы со своей моделью пришел к выводу что крайне сложно обучить нормальную модель на маленьком датасете. Менял токенизацию, параметры - не работает. Итого варианты1. Собрать больше данных - нужно от 30 мегабайт данных для обучения2. Использовать готовую модель от оллама и дообучить - это размер и время
3. Плюнуть и стрпться на RAGЕсли нужны подробности - спрашивайте
Местное население такой фигней не страдает.
Если ты считаешь, что твоя кожа чем-то отличается от кожи араба, то ты не прав.
Не выпендривайся. А прочитай что я уже писал раньше. С 23 года работают над новым( условно) алгоритмом Mamba(SSM) которому прочат замену обычному трансформеру. Знаешь отличия? Не знаешь, вот и не трынди. А я знаю. И еще знаю, что это работа для команд, исследователей с математическим образованием, с профессорскими степенями, а не кладовщику из техникума и даже не обладателю диплома БГУИР.Ты уже работаешь в ОпенАИ
Да, есть одиночки-гении, которые работают над этимю Ты - не из их числа. Ты за год даже не научился правильно формулировать проблему. Только после того как я сто раз написал про матричные вычисления ты стал писать про них. Но я в тупик могу загнать парой вопросов, на спор.
Ты вот даже не удосужился узнать различия, я прожед чем спорить - хотя бы погуглил нормально.
Перестань страдать фигней, давай обсуждать реальные вещи а не добывать в очрередной раз кремний из песка чтобы сложить 2+2
Я ранее уже говорил, что хочу на Rust написать свои ЯП, с модулями: базы данных, веб-сервер, нейросетью и др. для микросервисной системы.
Фреймворк - это инструмент облегчающий и ускоряющий работу, в нём нет полностью готовых рабочих проектов.
А CMS - это уже готовый проект(блог, магазин и тд.) который при необходимости можно менять, что-то добавлять, удалять уже готовые компоненты. Ну и контентом наполнить.
ЗЫ. Мне ли тебе объяснять..
Видишь - ты даже не можешь сформулировать правильно что такое ФФ и CMS!CMS - это не готовый проект! Это тоже инструмент для создания блога, магазина итд. В отличие от фреймворка он уже содержит какие-то готовые модули, упрошающие создание. Например админскую часть. Но в нем есть вшитые ограничения. Например Вордпресс успользует уже структурированную базу данных, которую не очень удобно расширять - там это костыли в виде метаданных. на основе готовых таблицФреймворк же тебе дает свободу использовать базу как угодно, просто представляет(или нет) какую-то ОРМ. А ты пытаешься зашить создание таблиц в ХТМЛ.Точно так же ларавел тебя не ограничивает в выюоре фронтенда - он отделен. А ты впился в свой XML. Разделяй темы о которых мы говорим и не мешай все до кучиСьехали на нейросети - так и будь в теме без туманных намеков.