LikeAVirgin

Рейтинг
147
Регистрация
05.09.2011
Ivanov123 #:

За 2 дня 20 000 строк кода - покрытие тестами кодовой базы рабочего проекта. ДВАДЦАТЬ ТЫСЯЧ СТРОК. 

Мне тоже Claude много строчек написал, пахал, родный, трудился. Все работало до поры до времени, потом начал захлебываться. Фиксить тут, патчить там, одно починит, другое сломает. Я потом две недели его код с ним же разбирала на части и приводила его в чувство. ДВЕ недели на то, что он быстро и уверенно напахал, сожрав огромное количество токенов. Количество - не качество. 
ctit ctit #:
Пользователи в соцсетях начали обсуждать, что Claude Code может намеренно выполнять лишние итерации (циклы) в процессе написания или исправления кода. Поскольку использование Claude Code расходует токены (и, соответственно, деньги пользователя), возникло подозрение, что такая архитектура выгодна компании для увеличения выручки.

Клод случайно списывает деньги с моей карты за подписки, которые я не покупал?

https://www.reddit.com/r/claude/comments/1sbrh6x/claude_randomly_charging_my_card_for/?tl=ru

Началось: меня забанили в Claude Code на аккаунте за $200

https://habr.com/ru/articles/1021936/

Клод заставил меня влипнуть на $1200 по кредитке

https://www.reddit.com/r/claude/comments/1rjit4t/claude_made_me_stuck_with_a_1200_credit_card/?tl=ru

Три гвоздя в крышку гроба Claude Code, которые они забили сами

https://habr.com/ru/articles/1021994/
Если жалобы рядовых пользователей на то, что Claude Code "отупел", можно списать на когнитивные искажения и теории заговора, то когда подключаются люди уровня AMD AI Director, да еще и с супер детальным исследованием, становится по-настоящему тревожно.

Из мой недавней практики. Сами виноваты. Простой проект, простой код. Все путём. Добавляется сложность и ИИ начинает нести пургу. Сначала чуть-чуть, потом пурги становится все больше и больше. Если агента не контролировать, а просто кормить ему одну фичу за другой, то код превратится в тёмный лес. И чтобы в этом лесу ориентироваться ему нужно много итераций и много токенов. 

Это не зло, это просто так работает, если снять контроль или не иметь его с самого начала. Выхода два: или с самого начала жёсткая понятная архитектура проекта и указание "шаг в сторону растрел". Но для этого нужно разумно спланировать всю структуру перед началом кодинга. 

Второй вариант, если изобретаем и придумываем в процессе кодинга, то вести на жёстком поводке. Давать спланировать, откорректировать план, дать написать. По мере роста делать рефакторинг.

Я сама программист, но с вайб-кодингом не подружилась. Ии агентам не доверяю. Пишу мелкие задачи, прошу спланировать, корректирую план, итерация, и только потом код. Получается дёшево и сердито в плане токеном. Чистый, понятный код. Но в разы медленней, чем вайб-кодинг.

yodda #:

У меня все везде переходит, у вас какие то проблемы с интернетом видимо. Все работает как и раньше. 

А вы в какой стране находитесь? Про блокировки в РФ случаем не слышали? Про белые списки тоже? Про ТПСУ, РКН и вот это все? Почитайте на досуге, погуглите, интересные вещи. Или это не про (для) вас и вы для доступа к запрещенному контенту используте методы, нарушающие законы РФ?
Dmitriy_2014 :

Всем привет!

Всегда было интересно узнать, в каких еще странах мира, принято сгонять авто с крайнего левого ряда, едущего соблюдая скоростной режим, мигая ему дальним светом, бибикая, и совершая опасные маневры, типа бычки, или это только у нас в Бутово так :)?

Может в США есть такое, или там в Японии, Германии, Израиле, ОАЕ, Испании, Франции, короче где это еще норма, ну кроме Африки и совсем уж там отсталых типа вьетнама, индии и т.п.
Немцы так делают. Не только в Германии, а и в соседних странах и за это их жутко не любят. 😀
Sly32 #:
Для этого не нужен именно мой тьютор, инфы хорошей по РАГ предостаточно. 
А для чего он нужен? 😀 Инфы везде хорошей предостаточно, и плохой тоже. Пока отсортируешь мух от котлет, инфа уже устареет и время улетит. Поэтому нужны тьюторы, чтобы актуально и правильно. 😊
Sly32 #:

- парсинг информации с нужных тебе источников

- сканирование и распознавание, в том числе и заметок на полях

- загрузка текстов напрямую

Все это чистится от мусора, естественно не руками. бьется на чанки с перекрытием и загружается в базу

Так же как ты свою информацию поддерживаешь. Вся информация в базе храниться по темам и подразделам(опционально) Ты можешь посмотреть и удалить неактуальное. Но кроме этого, в связке


Но вот это уже как бы пройденный этап. Пробовала парсить, чанки - ембединги, само собой, складывала в pgvector. То, что документаций на 100% актуальных и полных не бывает - это факт. Т. е. где-то устарело, где-то забыли добавить. К тому же там еще были намешаны описания дополнительных опциальных модулей. У обучающего прав на его установку не было. Поэтому в ходе сбора нужно было убирать всю информацию по допмодулям. Но чисто не получилось. Оставались ошметки. Додумалась еще пропарсить GUI через playwright, чтобы было реально видно, что видит пользователь в натуре. Дальше генерировала на основе обучающий контент. Естественно в GUI были незадокументированные фичи. Возникал вопрос по Чернышевскому "Что делать?":
1. Дать ИИ погадать в контексте RAG, что это могло быть.
2. Ограничить его, чтобы честно выдавал "я, хз, что это такое"
Дальше выходило обновление какой-то библиотеки. Его нужно было забить в RAG, не проблема. А дальше нужно было перегенировать весь статичный обучающий контент, чтобы это изменение учесть. Тут у меня вынесло мозг и закончились токены.

Результат: весь эксперимент был выброшен на помойку.

И вот пока я это все писала, я подумала, sly, а не мог бы твой ИИ тутор научить меня создавать RAG, чтобы с самого начала правильно, максимально на автомате, но чисто. И при этом не пожирая 10000000 токенов для изменения двух строчек? Может?

Сергей про е-ком #:
Я тебе отвечу, как я делал. ) У меня быда задача - научиться делать конкретную вещь на Python.
А это другая целевая группа. Тут, ты хотел научиться. А я смотрю с другой стороны, я хочу научить. ;)
Я знаю, как правильно, я делаю ручками. Я вижу галюцинации и понимаю, что для обучения других (не меня) я не могу это использовать без четких рамок. Может быть RAG здесь даже не выход, это я в него уперлась, потому что пока другого выхода не вижу. Короче, как ограничить галюцинации до минимума? Потому что все эти темы, объяснения, квизы заканчиваются там, где начинается смесь документаций (старые/новые версии), переводы интерфейсов на другой язык, или просто отсуствие какой-то информации в открытом доступе, где ИИ начинает важно выдумать несуществующие функции, меню, кнопки.
Sly32 #:
Как ты это видишь себе?
Я вижу шанхай в виде документаций, публичных и закрытых, заметки на полях, сообщения об обновлениях/изменениях, 100500 источников. 
Я не о Python basics, для этого есть достаточно ресурсов. Я о том, что в принципе не существует или существует, но очень быстро устаревает.
Тройная боль:
- как накормить RAF существующим хаосом
- как поддерживать его в актуальном состоянии
- как делать ревью сгенерированного контента, не читая каждой строчки


Sly32 #:
Как запихать - это тоже работа. Это отдельный функционал системы, позволяющий загружать данные из разных источников. А задача системы - правильно данные систематизировать. 
Вот если это когда-нибудь будет, мне будет лично очень интересно. Пока то, что я вижу: такой своеобразный custom ChatGPT с вопрос/ответ системой и неконтролируемыми галлюцинациями. 😏 
Sly32 #:
Ну и я использую advanced RAG, который позволяет практически полностью исключить галлюцинации за счет реранкинга и повторных цепочек вопрос-ответ

Вот в это все и упирается. Остальное написать/создать/закодить не проблема. Как создать качественный RAG, если информация в принципе на 30% в неструктурированном виде в голове репититора. Как запихать его голову в RAG?

Я понимаю, что это уход от темы. Но лично для меня любое создание контента для обучения на данном этапе упирается в RAG. Все остальное - это код, который пишется в 2-3 дня. Не проблема.

Всего: 608