Mac Studio M5 Ultra 512gb ram, ждем?

Mik Foxi · 2026-05-21T13:08:10.0000000Z

Кто ждет выхода Mac Studio M5 Ultra 512gb ? будем брать? Чтоб не юзать облачные ИИ, а все запускать локально. Но если 512 не выйдет, а будет 256, то я расстроюсь, это мало и на перспективу не перспективно.

49

En0w1na

22 мая 2026, 16:04

#11

Mik Foxi #:

если просто для анализа кода на уязвимости и недоработки, так локальные с убранной цензурой рвут опус 4.7, находят больше проблемных мест в коде, на которые стоит обратить внимание.

Это какие по вашему локальные ллм "рвут опус 4.7"?

То что облачные ллм не хотят детально анализировать эксплойты из соображений безопасности это правда, но это лишь часть кодинга и ту которую при настойчивом промте можно обойти. Но не в одних бенчамарках я не вижу чтобы кто-то обходил опус.

Mik Foxi #:

в 32 гб видео памяти влазит и норм работает по качеству из того что попробовал:

bartowski/cerebras_Qwen3-Coder-REAP-25B-A3B-GGUF - в целом в программировании соображает.

unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF - для агентского программирования норм.

bartowski/DeepSeek-R1-Distill-Qwen-32B-abliterated-GGUF - для программирования и особенно для секьюрити-аудитов.

На чем сейчас запускаете? Я вижу что мак-мини 32гб+ везде выкуплены, а на ebay какомнибудь они 2200 usd+ за 32гб версию, а за эти деньги можно уже GMKtec EVO-X2 AI Mini PC AMD Ryzen™ AI Max+ 395 купить пару месяцев назад были примерно по 2400 USD (сейчас уже 3349 usd) или rtx 4090 24gb. Понятно что ryzen еще уступают m4 в скорости, но и на 128гб можно больше модель запихнуть чем на 32гб. По сабжу, тоже надеюсь что m5 сделает прорыв в этом направлении. С одной стороны можно 10к потратить на такое дело, а с другой сейчас каждый производитель участвует в гонке и что было актуально еще год назад будет оставаться далеко позади с новыми технологиями. Intel еще может что сделают.

Beelink - лучшие миникомпы, Как оплатить Hetzner? MacOs vs Windows

49

En0w1na

22 мая 2026, 16:18

#12

Интересно, вот клауд/codex/gemini/grok(пытается) рассчитаны на кодеров. Но, они же должны понимать, что гик сообщество оно на то и есть гик сообщество, что мы сами себе купим железо и все настроим и в их АПИ смысл упадет как только можно будет локально реально свой опус 4.7 без цензуры развернуть. Вроде там не дураки работают и должны были это просчитать, но при этом те миллиарды которые они вкладывают в свои дата центры удивляет. Во первых производители будут все лучше железо для локального ллм выпускать, а во вторых их собственное железо на которое они потратили столько денег будет быстро устаревать и при чем это страшный неликвид будет. Мне кажется что мы все просто перейдем на свои собственные ллм и они резко потеряют текущий доход от платящих подписок.

Если даже у обычного юзера будет возможность потратить 2-3к юсд на какойто новый minipc который позволит реально развернуть свою локальную опус 4.7 (да даже не опус, соннет достаточно) без лимитов и без цензуры и главное без платной подписки, то кто останется платить подписку клауд/codex/gemini/grok?

Защита от DOS на Лимиты Antygaravity Топ Яндекса как "зеркало

T

109

truebusiness

22 мая 2026, 16:36

#13

Мне кажется или ТС немного преувеличивает качество локальных LLM? У облачных LLM "лошадиная сила" не в 500 Гб RAM, а целые здания с серверами..

1268

Mik Foxi

22 мая 2026, 16:45

#14

En0w1na #:
Это какие по вашему локальные ллм "рвут опус 4.7"?

То что облачные ллм не хотят детально анализировать эксплойты из соображений безопасности это правда, но это лишь часть кодинга и ту которую при настойчивом промте можно обойти. Но не в одних бенчамарках я не вижу чтобы кто-то обходил опус.

мне опус не раз отказывался отвечать или угрожал заблочить мне ак 😀 что я хакер и плохой человек. при анализе уязвимостей в своих же скриптах, и его часто сложно убедить что я на доброй стороне.

bartowski/DeepSeek-R1-Distill-Qwen-32B-abliterated-GGUF голову не дурил и четко проверял и находил косяки и показывал варианты потенциального взлома.

En0w1na #:
На чем сейчас запускаете?

Beelink SER6-P https://bee-link.ru/ser6-p с 32 гигами, но это самый начальный уровень, хотя уже более менее влазят в память модели рабочие, но скорость 3-8 токенов в секунду, на прогерских задачах. тексты генерить/переводить до 19.

Beelink SER6-P — купить | Beelink Россия

bee-link.ru

Игровой мини-компьютер на AMD Ryzen™ 9 6900HX Base 3.30 GHz boost to 4.9 GHz, WiFi 6+Bluetooth 5.2, AUTO POWER ON WOL, HDMI+DisplayPort+USB4, Support 4K 144Hz displays Мини-ПК Beelink SER6-P оснащен процессором AMD Ryzen 9 6900HX с 8 ядрами и 16 потоками, работающим на частоте до 4,9 ГГц. Он предлагает до 32 ГБ оперативной памяти DDR5 и...

Антибот, антиспам, веб фаервол, защита от накрутки поведенческих: https://antibot.cloud/ (8 лет на защите сайтов).

Требования сверх ТЗ (спор) HostAce.ru - ищется вменяемый Какие скрипты партнерок стоит

1268

Mik Foxi

22 мая 2026, 16:47

#15

En0w1na #:
GMKtec EVO-X2 AI Mini PC AMD Ryzen™ AI Max+ 395

да вот эти AMD и на более новых 495 серии вполне могут стать заменой, если по цене будут конкурировать. я б что-то подобное купил бы, но в наших краях это заморочки с растаможкой, я в такое пока не умею заказывать 😀

Интернет-отдел Эксперта в поисках нужны советы по поисковой ePayments - электронный кошелек

49

En0w1na

23 мая 2026, 10:33

#16

Mik Foxi #:
да вот эти AMD и на более новых 495 серии вполне могут стать заменой, если по цене будут конкурировать. я б что-то подобное купил бы, но в наших краях это заморочки с растаможкой, я в такое пока не умею заказывать 😀

я его изучал и на 70B моделях он где-то 4-7 токена дает, а таким пользоваться невозможно имхо, разве что на ночь ему задачи оставлять и идти спать.

Ждем m5, ждем intel, и еще есть хороший вариант это взять Minipc который идет с oculink и например новую Intel Arc Pro B70 32гб vram правда пока еще софт сыроват в сравнении с CUDA.

на мак мини и студио много хороших вариантов но они все 3-7к юсд. Та ультра что на 512гб вышла вообще за 34 000 юсд на ибее перекупщики торгуют, но это уже не рациональная цена.

Механика роста позиции macbook pro retina 2012 Такой ноут стоит покупать?

49

En0w1na

23 мая 2026, 10:45

#17

truebusiness #:
Мне кажется или ТС немного преувеличивает качество локальных LLM? У облачных LLM "лошадиная сила" не в 500 Гб RAM, а целые здания с серверами..

Вам кажется. Локальные модели уже очень близко подбираются https://overchat.ai/ai-hub/best-local-llm-for-coding

58.7% на SWE-bench это примерно уровень начала 2025 года по облачным моделям. Если сравнивать с линейкой Claude:

Sonnet 4.6 (фев 2026): 79.6%
Sonnet 4.5 (сен 2025): 77.2%
Sonnet 4 (май 2025): 72.7%
Qwen3-Coder-Next: 58.7%
Claude 3.7 Sonnet (фев 2025): ~62%
Claude 3.5 Sonnet (2024): ~49%

Best Local LLM for Coding in 2026: Developer's Guide | AI Hub

overchat.ai

If you want to run an offline AI assistant for development, you’ll need a local LLM for coding. In this article, we break down the best options and the minimum VRAM required to run each one at a usable speed. If you’re looking for an offline AI app to run any of the models on this list, Atomic Chat is one of the fastest ways to get started...

Google Updates - апдейты Продажа 80 доменных имен Трафик с Яши =

1268

Mik Foxi

23 мая 2026, 10:46

#18

En0w1na #:
ждем intel

а у них что интересного ожидается?

Что такое Power BI и зачем это нужно бизнесу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах