master32

Рейтинг
110
Регистрация
09.02.2022
Genius Ideaing #:

перейдите на платный тариф и проверьте.. будет ли скорость доступа к сайту низкая.

на халяву грех жаловаться...

тормоза не зависят от тарифа,
весь не RU траф пропускают через ТСПУ,
последнее время тестируют новую фичу,
отсюда и тормоза

есть тормоза, подтверждаю, даже по пингам видно, увеличились в 2-3 раза от нормы
chaturanga #:

я занимаюсь именно тем чем мне надо для моих потребностей - нахожу минимальную модель, способную решить нужную мне задачу, с минимальными затратами и стабильно верно на длинной дистанции

для этого составляется пачка задач с известными ответами,
затем в несколько итераций прогоняется по кучке нужных моделей,
результаты можно обрабатывать с помощью того-же гпт,
это очень сильно экономит кучу времени)

chaturanga #:
Обделалась:

вы занимаетесь не тем)
маленькие модели не для такого рода задач)
это как брать маленькую отвертку и пытаться ей забивать гвозди)
а большая модель это как мультитул, только мулититулом тоже не стоит копать червей для рыбалки)

jsmith820 :
с какой стороны может вылезти установка чужого js?

это полный доступ к посетителям сайта, с ними можно делать все что угодно, подсовывасть свою рекламу, редиректить по гео, запускать майнеры и т.д.)

ничем не опасен, максимум куки-пароли админа могут увести)

Delysid #:

И серверное ядро есть в свободном доступе?

не знаю, нужно поискать)

не хаос #:
Если совсем по простому, для неикспертов, китайские пацаны сами придумали эту программу или позаимствовали?

эта программа в открытом доступе, любой может позаимствовать алгоритмы, спарсить сайты, токенизировать информацию и обучить свою модель)

chaturanga #:

Ну для желающих запускать на мобильниках.

Ryzen7 5700G со встроенной графикой
Модель deepseek-r1:70b
запрос

размышления опустил, там несколько страниц.

Заняло 58 минут

Утилизация проца 72%

Памяти как обещано ~40GB

Наблюдал за размышлениями, верное решение нашла где-то за 15 минут, потом формулировала объяснение, почему других решений нет.
В целом, для 70B, результат достойный, но на телефонах пока запускать рановато.

ИТмазахист)

Samail #:

Зачем мне сравнивать с  qwen-7b? Мне нужно было сравнить  то, что я могу по api  DeepSeek  получить, с тем что я могу без проблем на свой ПК установить. Нормальная версия DeepSeek-R1 у меня не запустится, а урезанная дает такие ответы, что смысла в ней нет. И вывод такой, что мне от возможности скачать  DeepSeek, по большому счёту выгоды никакой. По небольшому, может и будет. Если кто-то, у кого есть соответствующий сервер, скачает и запилит свой api, дешевле и с оплатой российскими картами.

затем, что эта модель "deepseek-r1-distill-qwen-7b" - это "надстройка" над "qwen-7b",
надстройка делает из базовой модели "размышляющую модель"
для полноценного дипсика надо брать модель 670в
а конкретные задачи проверять по заготовленному бенчмарку для этих задач на каждой модели
7b модели даже для переводчика "так себе" модели

Всего: 1643