И серверное ядро есть в свободном доступе?
не знаю, нужно поискать)
эта программа в открытом доступе, любой может позаимствовать алгоритмы, спарсить сайты, токенизировать информацию и обучить свою модель)
Ну для желающих запускать на мобильниках.
Ryzen7 5700G со встроенной графикойМодель deepseek-r1:70bзапрос
размышления опустил, там несколько страниц.
Заняло 58 минут
Утилизация проца 72%
Памяти как обещано ~40GB
Наблюдал за размышлениями, верное решение нашла где-то за 15 минут, потом формулировала объяснение, почему других решений нет. В целом, для 70B, результат достойный, но на телефонах пока запускать рановато.
ИТмазахист)
Зачем мне сравнивать с qwen-7b? Мне нужно было сравнить то, что я могу по api DeepSeek получить, с тем что я могу без проблем на свой ПК установить. Нормальная версия DeepSeek-R1 у меня не запустится, а урезанная дает такие ответы, что смысла в ней нет. И вывод такой, что мне от возможности скачать DeepSeek, по большому счёту выгоды никакой. По небольшому, может и будет. Если кто-то, у кого есть соответствующий сервер, скачает и запилит свой api, дешевле и с оплатой российскими картами.
затем, что эта модель "deepseek-r1-distill-qwen-7b" - это "надстройка" над "qwen-7b", надстройка делает из базовой модели "размышляющую модель"для полноценного дипсика надо брать модель 670ва конкретные задачи проверять по заготовленному бенчмарку для этих задач на каждой модели7b модели даже для переводчика "так себе" модели
кстати, судя по всему не то сравнивал)надо сравнивать полную модель "qwen-7b" и "deepseek-r1-distill-qwen-7b", чтобы сделать выводы)
сайтов которые так делают фактически многооднако формально правила запрещают так делать получается