Обсуждаются сложности обучения ИИ и проблемы с кодом - Самые разные темы

Челендж на 2026

Александр Воробьев · 2026-01-14T12:06:53.0000000Z

Предыстория. В одной из тем было заявлено nomarketing # : Просто если бы дело было в реале, было бы проще. Просто дать всем по пк и задать задачу, к примеру дописать функционал ввиде модуля или плагина. С возможностью пользоваться поисковиком, к примеру энное кол-во раз. Могу сказать с 90% вероятностью, что начинающие просто не осилят, максимум на базе каких-то ответов со stack, не более. Потому что как я уже говорил, без опыта, смогут только лишь поверхностно решить задачу, но, не реализовать её как нужно в полной мере. То есть, после них нужно будет допиливать в лучшем случае то что они не учли в худшем весь прототип функционала. Слово за слово. Было решено устроить челендж на весь год. Правда участников на данный момент двое, задачи разные. Т.е. и результаты оценки условные. Одним из условий было очень ограниченно использовать чужой код, оценивается только "своя работа в ходе челенджа". Вторым раз в неделю "отчет", в каком формате - каждый выбирает сам. Кто хочет может присоединиться - присоединяйтесь, приветствуется обсуждения, критика, которая, надеюсь не перерастет в переходы на личности. Далее каждый сам описывает цели, задачи ожидаемый результат своей работы

S3

390

Sly32

2 июня 2026, 05:59

#461

ArbNet #:
Только у меня есть знания, пусть я не оперирую общепринятыми терминами, потому как беру информацию из памяти, когда где то читал, тестил и тд. и пытаюсь сказать именно своими словами, как могу.

Почему в памяти у тебя информация не хранится в правильном формате? Если ты что-то прочитал и понял - у тебя не возникнет больших сложностей хотябы придерживаться правильной терминологии. Вот для тебя нэйминг - пустой звук, паттерны проектирования - тоже. Если ты не можешь ясно изложить свою мысль - значит этой мысли нет.

ArbNet #:
А по тебе сразу видно ни буб-бум информация взята из интернета

Я практически никогда не пишу о темах, которые мне далеки - ты мог бы это заметить уже. Даже по форуму - я вообще не захожу в темы, которые вне сферы моих интересов. Да, я постоянно гуглю перед ответом, сверяюсь с ИИ. Но это для того, чтобы изложить свою мысль понятнее и точнее. Могу забыть какое то слово, термин. Что толку выкладывать кашу из головы. А так я даю тебе понятный и структурированный ответ, более того - сам перезапоминаю информацию эту. Но я не стану писать про то, что для меня темный лес. Я начал излагать факты по строению нейросетей только после того как полез, вспомнил элементраную математику, что в них используется и как. Чтобы не выдать такие перлы как ты про матрицы. Мне было бы стыдно такое писать.

ArbNet #:
Плюс у тебя отсутствует соображение, это не оскорбление, лично мне это сразу бросается в глаза, поэтому я об этом и говорю

Ну, аргументируй на примерах, я не против увидеть свои пробелы.

ArbNet #:
Мне достаточно посмотреть на продукт как он работает, даже не смотря на код, я могу сразу выявлять ,что в нём плохо

Почему же ты не смог этого сделать на примере моего сервиса, я дал тебе ссылку. Давай, как программист - оцени что именно плохо там, не общими словами.

ArbNet #:
Всё придумали до нас, всё сделали до нас, всё супер, делай как пишут в книжках, интернете..

Что бы делать лучше - нужно сначала узнать как уже сделано. Очень рекомендую

Кому нужно портфолио - Резкое падение позиций в Что вы делаете, когда

S3

390

Sly32

2 июня 2026, 06:41

#462

А вообще пока что все тюнинги, новые токенизаторы и прочие улучшения приводят к все более бредовым результатам, модель превращается в "районный ИИ/экономист" 😂 Я уже почти готов сдасться и вернутсья к РАГ, отбросив идею экономии на токенах Попробую подготовить максимально большой датасет для обучения..
Вот кстати, Арбнет - тебе задачка на знание ИИ, раз уж ты изучил все про нейросети. Решается она в голове, кстати - ничего сложного
Вот параметры результативной модели при обучении на 37Кб данных с 4-ми слоями и 4-мя головам, тиктокеном на 100000 слов - 330мегабайт. По размерам - норма.
Насколько размер модели будет расти если я увеличу датасет, допустим до 15 Мб? Нужно знать, когда модель превысит 4Гига и потеряется смысл в тренинге, ведь тогда лучше взять готовую SLM
не нужно точных цифр - примерная апроксимация

Эксперимент с индексацией автонаполненного Что может, что не Может ли качественный хостинг

S3

390

Sly32

3 июня 2026, 09:24

#463

Sly32 #:
Вот кстати, Арбнет - тебе задачка на знание ИИ

Ответа так и не последовало, как вы все видите. Вывод - все это пустая болтовня про знание ИИ... Впрочем этого следовало ожидать.

После 3-х дней работы с Pytorch пришел к выводу что все это хорошо только для обучения и понимания как работает, от чего зависит, какие апарметры итд. Практической ценности нет.

Критически важный момент - датасет. В домашних условиях одному практически нереально собрать такой, чтобы на нем можно было натренировать мало-мальски полезную модель. А для тренировки нужен очень хороший. И обьемный. Просто накидать туда инфы для обьема - не получается.

В итоге проще отказаться от этого варианта, потому что использование как ОЛЛама с небольшой моделью+RAG так и fine-tuning - предпологают использование базовой модели около 4 гигов, что требует в идеале отдельного сервера под нее. На данный момент для меня это нецелесообразно.

По-прежнему - кому охота поиграться - в личку скину репку, чтоб не возиться с настройками. Там уже есть готовая обертка для тренировки модели - дерзайте)

Что сейчас в IT Управляющие ИМами [Бесплатное] Обучение арбитражу трафика!

64

Александр Воробьев

5 июня 2026, 05:01

#464

Ответвление от челенджа :)

Решил я попробовать использование агентов. И для этого "теста" решил добавить усложнение взять фреймворк которые ИИ не знают. т.е. как раз вот мой. И попробовать написать к нему модуль. При этом условие: я не должен вообще ни строчки написать в нем.

В качестве функционала простейшее: генерировать аватар по нику.

Сначала взял GigaCode - он лихо начал, и быстро написал код. Я в нем видел ошибки, но такие что не сложно было бы исправить... Но вот дальше его переклинило два дня он мне выносил фоном мозг. и я просто плюнул. Был похож на вечно торопящегося джуна бросающегося переписать все каждый раз заново и забывая что делал...

Взял агента от яши. Этот уже шел медленно но очень кропотливо подходил. Постоянно возвращался к анализу фреймоврка (я ему, как и первому, сказал склонировать репозиторий фреймворка во временный каталог), и не просто перечитывал файлы но и порой использовал рефлексию для анализа. после создания очередного класса чекал синтаксис. В общем планомерно фоном сделал. (За день, но тут надо понимать, что он постоянно просил подтверждение действия, а я работал т.е. были и простои пока я увижу). В итоге сделал. И я его также попросил прикрутить стат анализ и анализ стиля кода - прогнать проверки и исправить. так же написать тесты, gitattributes и конфиг для докера (чтобы можно было использовать не только как модуль, но и как готовый сервис), а так же настроил и использовал тулзу версионирования. так же он делал своевременно коммиты ... в общем справился.

Из проблем: несколько раз в php код вставлял json (думаю это бага плагина vscode) и два раза дублировал строки когда в composer.json добавлял скрипты

Результат здесь в доке есть описание как попробовать сервис через докер :)

GitHub - joke-php/avatar at c53b33f290fe64cbefff7dffd8f27bf0726f9feb

joke-php
github.com

Библиотека для генерации квадратных PNG-аватаров на основе никнейма для PHP-фреймворка Joke. Генерация квадратных PNG-аватаров на основе никнейма 6 встроенных тем оформления: , , , , , Декоративные квадраты на аватаре (случайное количество, размер и цвет) Отображение первых двух символов никнейма Кэширование сгенерированных аватаров в Поддержка...

Выгорел в конце проекта Что лучше: заказать у учить php на фремфорке

S3

390

Sly32

5 июня 2026, 06:15

#465

Александр Воробьев #:
Из проблем: несколько раз в php код вставлял json (думаю это бага плагина vscode) и два раза дублировал строки когда в composer.json добавлял скрипты

Это нормальное поведение - представь что ты кодишь с исполнительным джуном -мидлом юез фантазии. Если его не ткнуть носом - он и будет лепить все в кучу. Я изначально не проверял это, запуская проект, в итоге у меня масса модулей в которых JS code в HTML не подключен модулем а прямо впихнут - как и цсс. Лежит отдельная задача на рефакторинг - руки не доходят. Нужно все это явно указывать в агенте. Примерно так

### HTML/CSS/JS

- Follow best practices for web development

- Ensure responsive design and accessibility

- Use semantic HTML and modular CSS (e.g., BEM methodology)

- Write clean, maintainable JavaScript with proper event handling and state management

- all CSS and JS should be included in the project structure /static and properly linked in templates

- if you add new pages, ensure they extend the base template and include the navbar for consistency

Мне кажется у тебя небольшая ошибка в описании

Не "При использовании". А "Без" 😀 Но мне кажется что все, кто хоть раз запускал докер - понимают как запустить правильно нужную конфигурацию.
Я бы вообще добавил Makefile для таких случаев

Что может, что не Обновление CMS - падение Требуется переводчик, тематика "веб-разработка"

64

Александр Воробьев

5 июня 2026, 06:21

#466

Sly32 #:
Не "При использовании". А "Без" 😀 Но мне кажется что все, кто хоть раз запускал докер - понимают как запустить

хе-хе... а чет даже не вчитался. проверил, что инструкция работает и норм.... пасиб

Sly32 #:
Я бы вообще добавил Makefile для таких случаев

хм... подумаю (точнее в случае этого модуля: заставлю)

64

Александр Воробьев

5 июня 2026, 06:23

#467

Sly32 #:
Это нормальное поведение - представь что ты кодишь с исполнительным джуном -мидлом юез фантазии. Если его не ткнуть носом - он и будет лепить все в кучу. Я изначально не проверял это, запуская проект, в итоге у меня масса модулей в которых JS code в HTML не подключен модулем а прямо впихнут - как и цсс. Лежит отдельная задача на рефакторинг - руки не доходят. Нужно все это явно указывать в агенте. Примерно так

Но ведь это ни чего не ломало? А тут прям по среди php кода json бахнут (ну видно что сырой ответ LLm ки) или в том же json дублирование с нарушением формата json

Ozon - это зло, JSON тестинг HELP Проблема с WP (Ошибка

64

Александр Воробьев

5 июня 2026, 06:27

#468

к слову, в ходе первого подхода к агентам узнал про MCP. И поставил себе пометку сделать для фреймворка MCP сервер. (так же чисто по фану и изучения для)

132

master32

5 июня 2026, 06:29

#469

Александр Воробьев #:
фреймворк которые ИИ не знают. т.е. как раз вот мой

могу посоветовать прогнать проект через codeindexer и составить карту, тогда агентам будет легче ориентироваться и использовать меньше токенов

2

S3

390

Sly32

5 июня 2026, 06:40

#470

Александр Воробьев #:
Но ведь это ни чего не ломало? А тут прям по среди php кода json бахнут (ну видно что сырой ответ LLm ки) или в том же json дублирование с нарушением формата json

Часто бывало что код получался ломаный, особенно при повторных правках. Агент улучшает ситуацию.

Александр Воробьев #:
И поставил себе пометку сделать для фреймворка MCP сервер.

Это просто стандарт от Антропика. Если твой агент умеет читать код, править его или там ходить в интернет и искать на гитхабе инфу - значит в нем уже есть тула подобная МСР

cloudflare.com зло? В каком формате плагин Что может, что не

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Челендж на 2026