перейдите на платный тариф и проверьте.. будет ли скорость доступа к сайту низкая.
на халяву грех жаловаться...
тормоза не зависят от тарифа,весь не RU траф пропускают через ТСПУ, последнее время тестируют новую фичу, отсюда и тормоза
я занимаюсь именно тем чем мне надо для моих потребностей - нахожу минимальную модель, способную решить нужную мне задачу, с минимальными затратами и стабильно верно на длинной дистанции
для этого составляется пачка задач с известными ответами, затем в несколько итераций прогоняется по кучке нужных моделей, результаты можно обрабатывать с помощью того-же гпт,это очень сильно экономит кучу времени)
вы занимаетесь не тем)маленькие модели не для такого рода задач)это как брать маленькую отвертку и пытаться ей забивать гвозди)а большая модель это как мультитул, только мулититулом тоже не стоит копать червей для рыбалки)
это полный доступ к посетителям сайта, с ними можно делать все что угодно, подсовывасть свою рекламу, редиректить по гео, запускать майнеры и т.д.)
И серверное ядро есть в свободном доступе?
не знаю, нужно поискать)
эта программа в открытом доступе, любой может позаимствовать алгоритмы, спарсить сайты, токенизировать информацию и обучить свою модель)
Ну для желающих запускать на мобильниках.
Ryzen7 5700G со встроенной графикойМодель deepseek-r1:70bзапрос
размышления опустил, там несколько страниц.
Заняло 58 минут
Утилизация проца 72%
Памяти как обещано ~40GB
Наблюдал за размышлениями, верное решение нашла где-то за 15 минут, потом формулировала объяснение, почему других решений нет. В целом, для 70B, результат достойный, но на телефонах пока запускать рановато.
ИТмазахист)
Зачем мне сравнивать с qwen-7b? Мне нужно было сравнить то, что я могу по api DeepSeek получить, с тем что я могу без проблем на свой ПК установить. Нормальная версия DeepSeek-R1 у меня не запустится, а урезанная дает такие ответы, что смысла в ней нет. И вывод такой, что мне от возможности скачать DeepSeek, по большому счёту выгоды никакой. По небольшому, может и будет. Если кто-то, у кого есть соответствующий сервер, скачает и запилит свой api, дешевле и с оплатой российскими картами.
затем, что эта модель "deepseek-r1-distill-qwen-7b" - это "надстройка" над "qwen-7b", надстройка делает из базовой модели "размышляющую модель"для полноценного дипсика надо брать модель 670ва конкретные задачи проверять по заготовленному бенчмарку для этих задач на каждой модели7b модели даже для переводчика "так себе" модели