master32

Рейтинг
116
Регистрация
09.02.2022
chaturanga #:

я занимаюсь именно тем чем мне надо для моих потребностей - нахожу минимальную модель, способную решить нужную мне задачу, с минимальными затратами и стабильно верно на длинной дистанции

для этого составляется пачка задач с известными ответами,
затем в несколько итераций прогоняется по кучке нужных моделей,
результаты можно обрабатывать с помощью того-же гпт,
это очень сильно экономит кучу времени)

chaturanga #:
Обделалась:

вы занимаетесь не тем)
маленькие модели не для такого рода задач)
это как брать маленькую отвертку и пытаться ей забивать гвозди)
а большая модель это как мультитул, только мулититулом тоже не стоит копать червей для рыбалки)

jsmith820 :
с какой стороны может вылезти установка чужого js?

это полный доступ к посетителям сайта, с ними можно делать все что угодно, подсовывасть свою рекламу, редиректить по гео, запускать майнеры и т.д.)

ничем не опасен, максимум куки-пароли админа могут увести)

Delysid #:

И серверное ядро есть в свободном доступе?

не знаю, нужно поискать)

не хаос #:
Если совсем по простому, для неикспертов, китайские пацаны сами придумали эту программу или позаимствовали?

эта программа в открытом доступе, любой может позаимствовать алгоритмы, спарсить сайты, токенизировать информацию и обучить свою модель)

chaturanga #:

Ну для желающих запускать на мобильниках.

Ryzen7 5700G со встроенной графикой
Модель deepseek-r1:70b
запрос

размышления опустил, там несколько страниц.

Заняло 58 минут

Утилизация проца 72%

Памяти как обещано ~40GB

Наблюдал за размышлениями, верное решение нашла где-то за 15 минут, потом формулировала объяснение, почему других решений нет.
В целом, для 70B, результат достойный, но на телефонах пока запускать рановато.

ИТмазахист)

Samail #:

Зачем мне сравнивать с  qwen-7b? Мне нужно было сравнить  то, что я могу по api  DeepSeek  получить, с тем что я могу без проблем на свой ПК установить. Нормальная версия DeepSeek-R1 у меня не запустится, а урезанная дает такие ответы, что смысла в ней нет. И вывод такой, что мне от возможности скачать  DeepSeek, по большому счёту выгоды никакой. По небольшому, может и будет. Если кто-то, у кого есть соответствующий сервер, скачает и запилит свой api, дешевле и с оплатой российскими картами.

затем, что эта модель "deepseek-r1-distill-qwen-7b" - это "надстройка" над "qwen-7b",
надстройка делает из базовой модели "размышляющую модель"
для полноценного дипсика надо брать модель 670в
а конкретные задачи проверять по заготовленному бенчмарку для этих задач на каждой модели
7b модели даже для переводчика "так себе" модели

кстати, qwen max пока не обсуждают,
видимо без хайпа,
хотя в чем-то он лучше дикпсика)
Samail #:
Для эксперимента скачал локальную версию — deepseek-r1-distill-qwen-7b — и сравнил ответы на простые вопросы на полной версии и той, которую большинство сможет запустить на своем ПК

кстати, судя по всему не то сравнивал)
надо сравнивать полную модель "qwen-7b" и "deepseek-r1-distill-qwen-7b", чтобы сделать выводы)

Всего: 1791