Vachaslau

Рейтинг
377
Регистрация
29.03.2012
Должность
Software engineer
LikeAVirgin #:

Вот в это все и упирается. Остальное написать/создать/закодить не проблема. Как создать качественный RAG, если информация в принципе на 30% в неструктурированном виде в голове репититора. Как запихать его голову в RAG?

Я понимаю, что это уход от темы. Но лично для меня любое создание контента для обучения на данном этапе упирается в RAG. Все остальное - это код, который пишется в 2-3 дня. Не проблема.

Я же как раз кодер а не контентщик. Мне интересно создать систему, максимально удобную для использования. Как запихать - это тоже работа. Это отдельный функционал системы, позволяющий загружать данные из разных источников. А задача системы - правильно данные систематизировать. 

Ну и я говорил - для меня тут нет, по крайней мере пока, коммерческой составляющей. Просто развлечение.
Я в свое время занимался обучающими системами. До сих пор ей пользуется западный автоконцерн для обучения своих сотрудников. Поэтому примерно понимаю недостатки, вот и решил поиграться с умными системами.

LikeAVirgin #:
Вопросы интегрированы в сам урок?
Урок состоит из тем, которые будут разобраны во впремя урока. Для каждой темы можно прописать вопросы, можно добавить квиз
LikeAVirgin #:
Т. е. урок построен на основе объяснение, вопрос, ответ?

да

LikeAVirgin #:
И вопросы-ответы фиксированы. Т. е. никаких новых вопросов ИИ не придумывает?

вопросы генерирует ИИ на основе темы

LikeAVirgin #:
Если оно берется из RAG, то все туда и упирается. Создать качественный RAG (из чего?), и потом за ним ухаживать (расходы на человеческий ревью) и жить с тем, что даже с RAG ИИ может ошибаться....

Естественно нужен качественный для уменьшения галлюцинаций. Ну и я использую advanced RAG, который позволяет практически полностью исключить галлюцинации за счет реранкинга и повторных цепочек вопрос-ответ

LikeAVirgin #:
один раз пустить что-то на самотек или положиться на самобочение. 

Это не планируется как полностью самообучение. Это как дополнение к урокам репетитора. 

LikeAVirgin #:
LifterLMS
Это просто система создания онлайн обучения. ИИ-репетитор немного иной подход. Там нет фиксированных вопросов, есть только темы, которые будут разобраны в течение урока. Они зависят от твоих ответов. Если ты отвечаешь лучше - дальше может быть усложнение, хуже - упрощение.  Есть план урока. Но нет жестко фикисрованных вопросов - они каждый раз генерируются в процессе диалога.

ИИ репетитор посложнее. Но принцип тот же. Ты выбираешь тему, ИИ генерирует ее, потом правишь. Настраиваешь темы урока, продолжительность. Можно подключить квиз и тодга в фазе проверки ИИ не будет генерировать вопросы а будет брать их из квиза, причем в произвольном порядке - каждый раз - разные.

Сам ИИ урок проходит без участия живого репетитора. По итогам делается саммари. Сам урок записывается и на основании ответов ученика делается БД с его ответами, которые будуи учитываться при повторном прохождении а так же для отслеживания прогресса

Вот вкратце так

LikeAVirgin #:

Я не понимаю, откуда там берется информация для обучения? Она генерируется  самим ИИ on-fly и складывается в RAG? И для каждого ученика тогда свой RAG получается что-ли? Дополнительные темы для обучения предлагает ИИ? Там где-то есть вообще контроль человеческий или это полностью генерация? Квизы опять же on-the-fly создаются? И что с галлюцинациями, на каком этапе живой кожанный репититор там вообще в концепте существует? Или не существует.

Начну с квизов. Там две опции - создать руками или с помощью ии. Можно выгрузить из json файла определенного формата. Ты создаешь новый квиз и у тебя есть возможность сгенерировать его с помощью ИИ

При это предварительно ты можешь создать свою базу для RAG. загрузить свои вопросы с ответами. Есть возможность загнать просто картинку и система распознает ее и положит чанки в базу. Перед генерацией системпа проверит наличие  базы по даннной теме и будет использовать ее при генерации тестов. Когда тест сформирован - ты можешь уже править его ручками, если ИИ ошибся(а такое бывает) - исправляешь вопросы и ответы, добавляешь картинки(в преспективе их тоже можно будет сгенерить)

Для тестов выставляется уровень сложности а также можно включить анти-чит режим -  система будет отслеживать попытки погуглить в соседнем окне.
Сам тест уже работает без ИИ, только для саммари будет подключен для анализа ответов и выдачи рекомендаций.

не хаос #:
Зачем вообще изначально нужна была эта идея с созданием программы по автоматизации накрутки?
А где ты видел такую идею?
uigen от Anthropic тоже отлично умеет работать как с рисунками так и с текстовым описанием. Для тех кто любит в React/Next.js - просто находка. Правда пока не считал, столько обходится. Его можно подключать к плану и к токенам купленным.

За выходные сравнил разные модели для работы в пайплайне и для генерации кода. Opus Выигрывает по скорости генерации и по качеству кода. Но если нужна экономия - даже gpt-4.1  вполне справляется и с кодингом и с дебагом. Нормально правит свои косяки, если указать.
Для работы в пайплайне лучше всего Claude Hiaki 4.5  по сочетанию цена -качество. Он отлично держит диалог, не гонит по кругу вопросы а умеет задавать дополнительные вопросы по теме, лучше учитывает предыдущие ответы. Так как система умеет хранить все диалоги, планирую подключить RAG  не только для генерации курсов но и для ведения урока - тогда система будет знать предыдущие ответы ученика и подстраивать материалы под ранее пройденные темы. Получается вполне себе живой диалог. Урок на 40 минут сжигает примерно на 10 центов токенов. То есть вполне доступно получается как дополнительный материал. Ты прошел урок с репетитором и тебе открываются дополнительные темы для  изучения, мне кажется это вполне удобно. Плюс квизы.  Реально можно набивать руку по любым темам. 
Artisan #:
Да, обязательно, очень внимательно, Ваш текст был про великих мастеров, поисковое продвижение, механический разум, и семантическое ядро. Я ответил точно согласно Вашему тексту.
Понятно, раз у тебя контекстное окно маленькое и не в состоянии охватить требуемое - специально для тебя :
Мне неинтересно заниматься всякими продвиженческими сервисами. Попытка сотрудничества (трижды) не удалась. Тема закрыта. В других темах я давал краткое описание сервиса над которым вожусь в свободное 
Artisan #:
И напрасно не думал, явно есть спрос от великих мастеров на механизацию продвижения.
Ты вообще пробовал перечитать вопрос, на который отвечаешь?  Причем тут продвижение?
Парсить данные терабайтами - это задача для джунов, новичков у нас обычно садят писать парсеры.  Я это могу собирать прекрасно без тебя и лучше. Терабайты мусора никому не нужны. 
Всего: 7648