master32

Рейтинг
121
Регистрация
09.02.2022
Дмитрий Подстригаев #:
Безусловно, но у нас еще поиск источника и сильная база.
а что у вас под капотом используется, можно узнать?)

Sly32 #:
Хочу локально развернуть модель для  "бедных", кому жаль платить за токены
оно тебе нафиг не нужно, возьми gemini flash для бедных студентов и преподов, 100м токенов за $10)
нормально работающие локальные модели от 70B под rtx6000 96gb, еще куда ни шло, остальное под узкоспецифические задачи, но это все быстро устареет, поэтому не вижу смысла их тестировать
5090 можно взять в аренду за $150/m и там развернуть какой-нибудь дистилированный дипсик, дешевле только апи из логов юзать, но это уже серая тема)
мой вердикт - бери дешевый апи от гугла и ставь ограничение на пользователя по токенам, самый оптимальный и быстрый вариант

Sly32 #:
посоветуешь локальную модель хорошую? 
смотря для чего, включать светодиод по событию с помощью llm можно, а чудес расчудесных от таких моделей можно не ждать)
конкретно из последних использовал UI-TARS и MAI-UI, для специфичного закрывания всплывашек рекламы на мобилках)
из локальных рабочих моделей стоит пробовать запускать qwen 3.5 чем старше тем лучше, или glm5 но она тяжелее сомневаюсь что ноута хватит, все остальное хуже по моим наблюдениям
мой повседневный топ юзфул это codex 5.4, opus 4.6, gemini 3.1, grog 4.2
гоняться и выбирать лучше/дешевле не имеет смысла, через 1-3-6 месяцев все изменится)

Юлия #:
Вот смотрите: мне на днях один из супермаркетов прислал СМС с приглашением купить пачку сливочного масла за 1,09 евро. А Вы видели, сколько в России стоит сливочное масло?
в рф хорошее сливочное масло в мск стоит 3-4евро
leoseo #:
Ну что, как там в Европе, рост цен на всё уже чувствуется ? 
цены во всем мире растут, это глобальное мировое обнищание под соусом капиталистической инфляции

Sly32 #:
Да, есть такой  greedy decoding (temp=0, top_k=1, top_n=1) тогда ответ будет детерменированным. 
с кучей оговорок, конечно, но контекст когда детерминация используется в качестве индикатора надежности,
лично у меня много мелких моделей 1b-2b-4b-8b и там воспроизводимость результата очень важна и она возможна, llm это не рандомайзер, как некоторые считают

Sly32 #:
Математически - да, но ты забыл про sampling, который по факту делает ответы недетерменироваными
Даже если температуру =0 ставить
так это и есть включение рандомайзера и выбор алгоритма, сделай не sampling, и фиксированный seed и результат уже предсказуем, без потери качества

chaturanga #:
задача предсказать следующий токен и это предсказание не будет однозначным
только если ты указываешь параметр рандомайзера, а если рандомайзер зафиксировать, то результат абсолютно всегда будет одинаковым, более того этот результат можно просчитать вручную на бумаге)

chaturanga #:
Это не хорошо и не плохо, недетерменированность - это её "нормальность"
наверное многие тут не понимают, но llm это детерминированная система)
chaturanga #:
AI "математически" не допускает этого.

как это понять?
у всех нынешних AI точный математически предсказуемый результат

Vladimir #:
Так а толку, он же мне не даст  админить в бурже. 
толк в том, что он в белых списках, будет доступно все что доступно из кз, в том числе и "админить в бурже"
ребята заворачивают свой персональный ркн в этот гос-ркн, как говорится "береженого Бог бережет", сказала монашка, натягивая презерватив на свечку)
Всего: 1867