Челендж на 2026

S3
На сайте с 29.03.2012
Online
389
#461
ArbNet #:
Только у меня есть знания, пусть я не оперирую общепринятыми терминами, потому как беру информацию из памяти, когда где то читал, тестил и тд. и пытаюсь сказать именно своими словами, как могу.
Почему в памяти у тебя информация не хранится в правильном формате? Если ты что-то прочитал и понял - у тебя не возникнет больших сложностей хотябы придерживаться правильной терминологии.  Вот для тебя нэйминг - пустой звук, паттерны проектирования - тоже.  Если ты не можешь ясно изложить свою мысль - значит этой мысли нет.
ArbNet #:
А по тебе сразу видно ни буб-бум информация взята из интернета

Я практически никогда не пишу о темах, которые мне далеки - ты мог бы это заметить уже. Даже по форуму - я вообще не захожу в темы, которые вне сферы моих интересов. Да, я постоянно гуглю перед ответом, сверяюсь с ИИ. Но это для того, чтобы изложить свою мысль понятнее и точнее. Могу забыть какое то слово, термин. Что толку выкладывать кашу из головы. А так я даю тебе понятный и структурированный ответ, более того - сам перезапоминаю информацию эту. Но я не стану писать про то, что для меня темный лес. Я начал излагать факты по  строению нейросетей только после того как полез, вспомнил элементраную математику, что в них используется и как. Чтобы не выдать такие перлы как ты про матрицы. Мне было бы стыдно такое писать.

ArbNet #:
Плюс у тебя отсутствует соображение, это не оскорбление, лично мне это сразу бросается в глаза, поэтому я об этом и говорю

Ну, аргументируй на примерах, я не против увидеть свои пробелы.

ArbNet #:
Мне достаточно посмотреть на продукт как он работает, даже не смотря на код, я могу сразу выявлять ,что в нём плохо

Почему же ты не смог этого сделать на примере моего сервиса, я дал тебе ссылку. Давай, как программист - оцени что именно плохо там, не общими словами.

ArbNet #:
Всё придумали до нас, всё сделали до нас, всё супер, делай как пишут в книжках, интернете..

Что бы делать лучше - нужно сначала узнать как уже сделано. Очень рекомендую

S3
На сайте с 29.03.2012
Online
389
#462
А вообще  пока что все тюнинги, новые токенизаторы и прочие улучшения приводят к все более бредовым результатам, модель превращается в "районный ИИ/экономист" 😂 Я уже почти готов сдасться и вернутсья к РАГ, отбросив идею экономии на токенах Попробую подготовить максимально большой датасет для обучения..
Вот кстати, Арбнет - тебе задачка на знание ИИ, раз уж ты изучил все про нейросети. Решается она в голове, кстати - ничего сложного
Вот параметры результативной модели при обучении на 37Кб данных с 4-ми слоями и 4-мя головам, тиктокеном на 100000 слов - 330мегабайт. По размерам  - норма.
Насколько размер модели будет расти если я увеличу датасет, допустим до 15 Мб?  Нужно знать, когда модель превысит 4Гига и потеряется смысл в тренинге, ведь тогда лучше взять готовую SLM
не нужно точных цифр - примерная апроксимация
S3
На сайте с 29.03.2012
Online
389
#463
Sly32 #:
Вот кстати, Арбнет - тебе задачка на знание ИИ

Ответа так и не последовало, как вы все видите. Вывод - все это пустая болтовня  про знание ИИ... Впрочем этого следовало ожидать.

После 3-х дней работы с Pytorch пришел к выводу что все это хорошо только для обучения и понимания как работает, от чего зависит, какие апарметры итд. Практической ценности нет. 

Критически важный момент - датасет. В домашних условиях одному практически нереально собрать такой, чтобы на нем можно было натренировать мало-мальски  полезную модель. А для тренировки нужен очень хороший. И обьемный. Просто накидать туда инфы для обьема - не получается. 

В итоге проще отказаться от этого варианта, потому что  использование как ОЛЛама с небольшой моделью+RAG так  и fine-tuning - предпологают использование базовой модели около 4 гигов, что требует в идеале отдельного сервера под нее. На данный момент для меня это нецелесообразно.

По-прежнему - кому охота поиграться - в личку скину репку, чтоб не возиться с настройками. Там уже есть готовая обертка для тренировки модели - дерзайте)

Александр Воробьев
На сайте с 03.02.2020
Offline
63
#464

Ответвление от челенджа :)

Решил я попробовать использование агентов. И для этого "теста" решил добавить усложнение взять фреймворк которые ИИ не знают. т.е. как раз вот мой. И попробовать написать к нему модуль. При этом условие: я не должен вообще ни строчки написать в нем.

В качестве функционала простейшее: генерировать аватар по нику.

Сначала взял GigaCode - он лихо начал, и быстро написал код. Я в нем видел ошибки, но такие что не сложно было бы исправить... Но вот дальше его переклинило два дня он мне выносил фоном мозг. и я просто плюнул. Был похож на вечно торопящегося джуна бросающегося переписать все каждый раз заново и забывая что делал...

Взял агента от яши. Этот уже шел медленно но очень кропотливо подходил. Постоянно возвращался к анализу фреймоврка (я ему, как и первому, сказал склонировать репозиторий фреймворка во временный каталог), и не просто перечитывал файлы но и порой использовал рефлексию для анализа. после создания очередного класса чекал синтаксис. В общем планомерно фоном сделал. (За день, но тут надо понимать, что он постоянно просил подтверждение действия, а я работал т.е. были и простои пока я увижу). В итоге сделал.  И я его также попросил прикрутить стат анализ и анализ стиля кода - прогнать проверки и исправить. так же написать тесты, gitattributes и конфиг для докера (чтобы можно было использовать не только как модуль, но и как готовый сервис), а так же настроил и использовал тулзу версионирования. так же он делал своевременно коммиты ... в общем справился.

Из проблем: несколько раз в php код вставлял json (думаю это бага плагина vscode) и два раза дублировал строки когда в composer.json добавлял скрипты


Результат здесь  в доке есть описание как попробовать сервис через докер :)

GitHub - joke-php/avatar at c53b33f290fe64cbefff7dffd8f27bf0726f9feb
GitHub - joke-php/avatar at c53b33f290fe64cbefff7dffd8f27bf0726f9feb
  • joke-php
  • github.com
Библиотека для генерации квадратных PNG-аватаров на основе никнейма для PHP-фреймворка Joke. Генерация квадратных PNG-аватаров на основе никнейма 6 встроенных тем оформления: , , , , , Декоративные квадраты на аватаре (случайное количество, размер и цвет) Отображение первых двух символов никнейма Кэширование сгенерированных аватаров в Поддержка...
S3
На сайте с 29.03.2012
Online
389
#465
Александр Воробьев #:
Из проблем: несколько раз в php код вставлял json (думаю это бага плагина vscode) и два раза дублировал строки когда в composer.json добавлял скрипты

Это нормальное поведение  - представь что ты кодишь с исполнительным джуном -мидлом юез фантазии. Если его не ткнуть носом - он и будет лепить все в кучу. Я изначально не проверял это, запуская проект, в итоге у меня масса модулей в которых JS code в  HTML не подключен  модулем а прямо впихнут - как и цсс. Лежит отдельная задача на рефакторинг - руки не доходят. Нужно все это явно указывать в агенте. Примерно так

### HTML/CSS/JS
- Follow best practices for web development
- Ensure responsive design and accessibility
- Use semantic HTML and modular CSS (e.g., BEM methodology)
- Write clean, maintainable JavaScript with proper event handling and state management
- all CSS and JS should be included in the project structure /static and properly linked in templates
- if you add new pages, ensure they extend the base template and include the navbar for consistency



Мне кажется у тебя небольшая ошибка в описании

Не "При использовании". А "Без" 😀 Но мне кажется что все, кто хоть раз запускал докер - понимают как запустить правильно нужную конфигурацию.
Я бы вообще добавил Makefile для таких случаев

Александр Воробьев
На сайте с 03.02.2020
Offline
63
#466
Sly32 #:
Не "При использовании". А "Без" 😀 Но мне кажется что все, кто хоть раз запускал докер - понимают как запустить

хе-хе... а чет даже не вчитался. проверил, что инструкция работает и норм.... пасиб

Sly32 #:
Я бы вообще добавил Makefile для таких случаев

хм... подумаю (точнее в случае этого модуля: заставлю)

Александр Воробьев
На сайте с 03.02.2020
Offline
63
#467
Sly32 #:
Это нормальное поведение  - представь что ты кодишь с исполнительным джуном -мидлом юез фантазии. Если его не ткнуть носом - он и будет лепить все в кучу. Я изначально не проверял это, запуская проект, в итоге у меня масса модулей в которых JS code в  HTML не подключен  модулем а прямо впихнут - как и цсс. Лежит отдельная задача на рефакторинг - руки не доходят. Нужно все это явно указывать в агенте. Примерно так
Но ведь это ни чего не ломало? А тут прям по среди php кода json бахнут (ну видно что сырой ответ LLm ки) или в том же json дублирование с нарушением формата json
Александр Воробьев
На сайте с 03.02.2020
Offline
63
#468
к слову, в ходе первого подхода к агентам узнал про MCP. И поставил  себе пометку сделать для фреймворка MCP сервер. (так же чисто по фану и изучения для)
master32
На сайте с 09.02.2022
Offline
130
#469
Александр Воробьев #:
фреймворк которые ИИ не знают. т.е. как раз вот мой
могу посоветовать прогнать проект через codeindexer и составить карту, тогда агентам будет легче ориентироваться и использовать меньше токенов
S3
На сайте с 29.03.2012
Online
389
#470
Александр Воробьев #:
Но ведь это ни чего не ломало? А тут прям по среди php кода json бахнут (ну видно что сырой ответ LLm ки) или в том же json дублирование с нарушением формата json
Часто бывало что код получался ломаный, особенно при повторных правках. Агент улучшает ситуацию.
Александр Воробьев #:
И поставил  себе пометку сделать для фреймворка MCP сервер.
Это просто стандарт от Антропика. Если твой агент умеет читать код, править его или там ходить в интернет и искать на гитхабе инфу - значит в нем уже есть тула подобная МСР

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий